o ÙÜÓhÝã@s´UddlZddlZddlmZddlmZddlmZddlm Z m Z Gdd„deƒZGd d „d eƒZGdd„deƒZ Gd d„deƒZdae e e ejed<dejfdd„ZdS)éNé)Úcomm)ÚFunction©Ú_get_device_index)ÚListÚOptionalc@ó$eZdZedd„ƒZedd„ƒZdS)Ú BroadcastcGs¾tdd„|Dƒƒs Jdƒ‚dd„|Dƒ}||_t|ƒdkr tƒSt|ƒ|_|d ¡|_t ||j¡}g}t |j dd…ƒD]\}}|sP|D] }| ||¡qFq>|j|Žtdd„|DƒƒS) Ncsó|] }|jjdkVqdS©ÚcpuN©ÚdeviceÚtype©Ú.0Úi©rúR/var/www/html/ai/venv/lib/python3.10/site-packages/torch/nn/parallel/_functions.pyÚ ó€z$Broadcast.forward..z2Broadcast function not implemented for CPU tensorscSóg|]}t|dƒ‘qS©Tr©rÚxrrrÚ óz%Broadcast.forward..rrcSsg|] }|D]}|‘qqSrr)rÚtensorsÚtrrrrs) ÚallÚtarget_gpusÚlenÚtupleÚ num_inputsÚ get_deviceÚinput_devicerÚbroadcast_coalescedÚ enumerateÚneeds_input_gradÚappendÚmark_non_differentiable)Úctxr!ÚinputsÚoutputsÚnon_differentiablesÚidxÚinput_requires_gradÚoutputrrrÚforwards$ÿ € zBroadcast.forwardcGsdtj|j|jg|¢RŽS)N©N)ÚReduceAddCoalescedÚapplyr&r$©r,Úgrad_outputsrrrÚbackward szBroadcast.backwardN©Ú__name__Ú __module__Ú__qualname__Ústaticmethodr3r9rrrrr s r c@r )r5csL‡fdd„tdtˆƒˆƒDƒ|_‡‡fdd„tdtˆƒˆƒDƒ}t ||¡S)Ncsg|]}ˆ| ¡‘qSr©r%r)Úgradsrrr)sz.ReduceAddCoalesced.forward..rcsg|] }ˆ||ˆ…‘qSrrr©r@r$rrr+sÿ)Úranger"r!rÚreduce_add_coalesced)r,Údestinationr$r@Úgrads_rrArr3's ÿzReduceAddCoalesced.forwardcGsdtj|jg|¢RŽS)N©NN)r r6r!r7rrrr9/szReduceAddCoalesced.backwardNr:rrrrr5%s r5c@r )ÚGathercsÂtdd„|Dƒƒs Jdƒ‚|dkrdˆ_nt|dƒ}|ˆ_|ˆ_tdd„|Dƒƒˆ_tdd„|DƒƒrI|dkrItd d„|Dƒƒ}t d ¡dˆ_ndˆ_t‡fdd„|Dƒƒˆ_ t |ˆjˆj¡S) Ncsrrrrrrrr8rz!Gather.forward..z/Gather function not implemented for CPU tensorsr Tcss|]}| ¡VqdSr4r?rrrrrAó€css|] }| ¡dkVqdS©rN)Údim©rrrrrrBrrcss|]}| d¡VqdS)rN)ÚviewrKrrrrCs€zvWas asked to gather along dimension 0, but all input tensors were scalars; will instead unsqueeze and return a vector.Fc3s|] }| ˆj¡VqdSr4)ÚsizerJr©r,rrrJr)r Ú target_devicerrJr#Ú input_gpusÚwarningsÚwarnÚunsqueezed_scalarÚinput_sizesrÚgather)r,rOrJr-rrNrr36s ÿ zGather.forwardcCs6t |j|j|j|¡}|jrtdd„|Dƒƒ}d|S)Ncss|]}|dVqdSrIr)rÚgrrrrQrHz"Gather.backward..rF)ÚScatterr6rPrTrJrSr#)r,Úgrad_outputÚscattered_gradsrrrr9MszGather.backwardNr:rrrrrG4s rGc@r )rWc CsØdd„|Dƒ}||_|jjdkr| ¡nd|_d}tj ¡r*|jdkr*dd„|Dƒ}t ||||j|¡}|durjt |ƒD]-\}}tj ||¡tj ¡} | ||¡| | ¡Wdƒn1sdwYq<|S)NcSrrrrrrrrYrz#Scatter.forward..r éÿÿÿÿcSsg|] }tt d|¡ƒ‘qS)Úcuda)Ú_get_streamÚtorchr)rrrrrr_s)rJrrr%r&r]r[Úis_availablerÚscatterr(Úcurrent_streamÚwait_streamÚ record_stream) r,r!Úchunk_sizesrJÚinputÚstreamsr.rr2Úmain_streamrrrr3Ws ý€zScatter.forwardcGs dddtj|j|jg|¢RŽfSr4)rGr6r&rJ)r,rXrrrr9js zScatter.backwardNr:rrrrrWUs rWÚ_streamsrcCsh|jdkrdStt|jdƒ}|durdStdurdg| ¡at|jdur/| |j¡t|j<t|jS)zBGets a background stream for copying between CPU and target devicer N)rÚgetattrr]rgÚdevice_countÚindexÚStream)rÚ device_modrrrr\rs r\)rQr]ÚrÚtorch.autogradrÚtorch._utilsrÚtypingrrr r5rGrWrgrkÚ__annotations__rr\rrrrÚs !