X (Twitter)

Recrutement haut de gamme : Zhipu recrute des stagiaires en modélisation d’algorithmes à grande échelle. ----- Zhipu, stagiaire en algorithmes de modélisation à grande échelle à Pékin Description de l'emploi 1. Entraînement et optimisation de grands modèles : Participer au pré-entraînement, au réglage fin, à l'alignement et à l'optimisation des performances (tels que SFT, DPO, RLHF, etc.) des modèles de langage à grande échelle (LLM). 2. Mise en œuvre de scénarios d'application : En fonction des besoins métiers (systèmes de dialogue, génération de contenu, ChatBI, agents, etc.), maîtriser différentes méthodes de formation pour résoudre des problèmes concrets. Une expérience pratique en gestion de projet est un atout. 3. Recherche sur les technologies de pointe : Suivre les publications les plus récentes dans le domaine des grands modèles (tels que l'amélioration de l'architecture Transformer, la fusion multimodale, la technologie des agents, etc.), reproduire et vérifier les innovations ; 4. Résumé de l'expérience : Assistance à la rédaction de documents et de rapports techniques ; Exigences du poste : 1. Bases techniques : Connaissance de Python et des principaux frameworks d'apprentissage profond (PyTorch/TensorFlow) ; Maîtriser les bases du NLP (telles que les principes des modèles comme Transformer/BERT/GPT) ; 2. Expérience requise : Expérience des projets liés au NLP ; 3. Capacité d'apprentissage : Fort intérêt pour les techniques de modélisation à grande échelle ; capable de reproduire rapidement les résultats de la recherche et de résoudre des problèmes pratiques. 4. Compétences en communication : Logique claire, expression fluide et capacité à expliquer clairement les projets ; Points bonus : Articles publiés dans des conférences de premier plan (ACL/EMNLP/NeurIPS, etc.) ou contribution à des projets open source ; Familiarisé avec les méthodes efficaces de réglage fin des paramètres telles que l'entraînement distribué (Deepspeed/FSDP) et LoRA/P-Tuning ; Possède une expérience dans les domaines liés au multimodal (texte-image-vidéo) ou aux agents (AutoGPT/ReAct) ; ------ Pour plus de détails sur l'inscription, veuillez consulter : https://t.co/SgMGfxLGyw (recherche).

Fil de Y11 (@seclink)

Informations sur l'auteur

Contenu du fil