Recrutamento de alto nível: A Zhipu está recrutando estagiários para algoritmos de modelagem em larga escala. ----- Zhipu, estagiário de algoritmos de modelos em larga escala em Pequim. descrição do cargo 1. Treinamento e Otimização de Modelos de Grande Porte: Participar do pré-treinamento, ajuste fino, alinhamento e otimização de desempenho (como SFT, DPO, RLHF, etc.) de modelos de linguagem de grande escala (LLM). 2. Implementação de Cenários de Aplicação: Com base nas necessidades de negócio (como sistemas de diálogo, geração de conteúdo, ChatBI, Agente), o candidato deve ser proficiente no uso de diferentes métodos de treinamento para resolver problemas práticos. Candidatos com experiência prática em projetos terão preferência. 3. Pesquisa em tecnologia de ponta: Acompanhar os artigos mais recentes na área de modelos de grande escala (como aprimoramento da arquitetura Transformer, fusão multimodal, tecnologia de agentes, etc.), reproduzir e verificar as inovações; 4. Resumo da experiência: Auxiliar na redação de documentos e relatórios técnicos; Requisitos obrigatórios para a vaga: 1. Fundamentos técnicos: Familiaridade com Python e frameworks de aprendizado profundo convencionais (PyTorch/TensorFlow); Domine os fundamentos do PNL (como os princípios de modelos como Transformer/BERT/GPT); 2. Experiência necessária: Experiência com projetos relacionados a PNL (Processamento de Linguagem Natural); 3. Capacidade de aprendizagem: Forte interesse em técnicas de modelagem em larga escala; capaz de reproduzir rapidamente resultados de pesquisa e resolver problemas práticos. 4. Habilidades de comunicação: Lógica clara, expressão fluente e capacidade de explicar projetos com clareza; Pontos extras: Artigos publicados em conferências de alto nível (ACL/EMNLP/NeurIPS, etc.) ou contribuições para projetos de código aberto; Familiarizado com métodos eficientes de ajuste fino de parâmetros, como treinamento distribuído (Deepspeed/FSDP) e LoRA/P-Tuning; Possui experiência em áreas relacionadas a tecnologias multimodais (texto-imagem-vídeo) ou agentes (AutoGPT/ReAct); ------ Para obter detalhes sobre o cadastro, acesse: https://t.co/SgMGfxLGyw (pesquise).
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.