o ÚÜÓhèã@sjUddlmZmZmZmZddlZddlmmZ ddlm Z gZeee d<ejjGdd„dƒƒZdS)é)ÚDictÚListÚOptionalÚTupleN)ÚTensorÚ__all__c@sheZdZ ddeededeeefd ed ededed efdd„Zdee efdd„Z dS)Ú_FunctionalAdamaxçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>çFÚparamsÚlrÚbetasÚepsÚweight_decayÚforeachÚmaximizeÚ_allow_empty_param_listc Cs d|kstd|›ƒ‚d|kstd|›ƒ‚d|dkr"dks,ntd|d›ƒ‚d|dkr8dksBntd|d›ƒ‚d|ksMtd |›ƒ‚|||d|d|d œ|_||_||_tj ttjtt tjffi¡|_ t|ƒdkr~|s~tdƒ‚d|i|_dS) NrzInvalid learning rate: zInvalid epsilon value: rgð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid weight_decay value: )rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr ) Ú ValueErrorÚdefaultsrrÚtorchÚjitÚannotaterrÚstrÚstateÚlenÚparam_group) Úselfr rrrrrrr©r"ú_/var/www/html/ai/venv/lib/python3.10/site-packages/torch/distributed/optim/functional_adamax.pyÚ__init__s,û$z_FunctionalAdamax.__init__Ú gradientscCs„|jd}g}g}g}g}g}t|ƒt|ƒkr*tddt|ƒ›ddt|ƒ›ƒ‚t|jd|ƒD]V\}} | durˆ| |¡| | ¡||jvrni|j|<|j|} t d¡| d<tj|tj d| d <tj|tj d| d <|j|} | | d ¡| | d ¡| | d¡q2t ¡+tj||||||j d|j d|j d |j d|j d|j|jdWdƒdS1s»wYdS)Nr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: rÚstep)Ú memory_formatÚexp_avgÚexp_infrrrrr)rrrrrrr)r rrÚzipÚappendrrÚtensorÚ zeros_likeÚpreserve_formatÚno_gradÚFÚadamaxrrr)r!r%r Úparams_with_gradÚgradsÚexp_avgsÚexp_infsÚstate_stepsÚparamÚgradientrr"r"r#r&=sb ÿþÿ ÿ ÿ € ô"ÿz_FunctionalAdamax.stepN)r r rrFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatrÚboolr$rr&r"r"r"r#rs4÷þý üûúùø ÷(r)ÚtypingrrrrrÚtorch.optim._functionalÚoptimÚ_functionalr0rrrÚ__annotations__rÚscriptrr"r"r"r#Ús