1、深入理解自然语言处理(NLP)核心技术,熟悉
word2vec、BERT、GPT、Transformer、XLNet、RNN、LSTM 等主流深度学习模型及其原理; 2、精通 PyTorch 或 TensorFlow 等深度学习框架,具备大规模语言模型训练与微调的实际经验; 3、熟悉 LangChain、AutoGen 等智能体开发框架,了解 RAG、GraphRAG 等技术; 4、熟悉大模型蒸馏技术,具备教师模型与学生模型的训练经验; 5、对主流 强化学习理论与方法有一定理解,特别是 DPO、PPO、GRPO 等算法; 6、拥有学术研究背景或具备相关论文发表经验者先。 |