大模型架構(gòu)師
20000-30000元
3年以上
本科
3年以上
本科
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位信息待核驗(yàn),請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
一、崗位職責(zé)
1. 大模型技術(shù)架構(gòu)與體系建設(shè)
負(fù)責(zé)主流大語(yǔ)言模型(LLM)及多模態(tài)大模型的技術(shù)選型、架構(gòu)設(shè)計(jì)與落地實(shí)施;
搭建和優(yōu)化大模型訓(xùn)練、微調(diào)(Fine-tuning)、推理部署的全鏈路技術(shù)環(huán)境;
設(shè)計(jì)并實(shí)現(xiàn)大模型的高效推理方案,包括模型量化、蒸餾、并行推理、服務(wù)化部署等優(yōu)化策略;
跟蹤并引入業(yè)界前沿的大模型技術(shù)(如MoE、長(zhǎng)上下文、多模態(tài)融合等),推動(dòng)技術(shù)迭代。
2. 智能體(AI Agent)應(yīng)用開(kāi)發(fā)
負(fù)責(zé)智能體應(yīng)用的整體架構(gòu)設(shè)計(jì),包括規(guī)劃(Planning)、記憶(Memory)、工具調(diào)用(Tool Use)、多智能體協(xié)同(Multi-Agent)等核心模塊;
基于LangChain、LlamaIndex、AutoGen、Dify等框架,獨(dú)立開(kāi)發(fā)和落地智能體應(yīng)用;
設(shè)計(jì)并實(shí)現(xiàn)Agent與外部系統(tǒng)(API、數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、業(yè)務(wù)系統(tǒng))的高效集成方案;
探索并落地Agent在自動(dòng)化辦公、智能客服、代碼生成、數(shù)據(jù)分析等場(chǎng)景的應(yīng)用。
3. 大模型應(yīng)用工程化落地
負(fù)責(zé)RAG(檢索增強(qiáng)生成)系統(tǒng)的架構(gòu)設(shè)計(jì)與優(yōu)化,包括向量數(shù)據(jù)庫(kù)選型、Embedding模型優(yōu)化、召回策略設(shè)計(jì)等;
構(gòu)建大模型應(yīng)用的標(biāo)準(zhǔn)化開(kāi)發(fā)流程、模型評(píng)估體系及監(jiān)控運(yùn)維方案;
解決大模型在落地過(guò)程中的性能、穩(wěn)定性、安全性及合規(guī)性問(wèn)題。
4. 技術(shù)攻關(guān)與團(tuán)隊(duì)協(xié)作
獨(dú)立或帶領(lǐng)團(tuán)隊(duì)攻克大模型訓(xùn)練、推理及應(yīng)用中的關(guān)鍵技術(shù)難題;
輸出技術(shù)文檔、***實(shí)踐,推動(dòng)團(tuán)隊(duì)技術(shù)能力提升;
與產(chǎn)品、業(yè)務(wù)團(tuán)隊(duì)緊密協(xié)作,將技術(shù)能力轉(zhuǎn)化為實(shí)際業(yè)務(wù)價(jià)值。
二、任職資格
1. 學(xué)歷與經(jīng)驗(yàn)要求
計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)等相關(guān)專(zhuān)業(yè),本科及以上學(xué)歷(碩士/博士?jī)?yōu)先);
3年以上人工智能相關(guān)研發(fā)經(jīng)驗(yàn),有完整的大模型項(xiàng)目落地經(jīng)驗(yàn);
有大模型訓(xùn)練、微調(diào)或智能體應(yīng)用的實(shí)際上線(xiàn)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
2. 核心技術(shù)能力
編程基礎(chǔ):精通Python,熟悉C 或Go者優(yōu)先;具備良好的代碼規(guī)范和工程化能力;
深度學(xué)習(xí)框架:熟練掌握PyTorch、TensorFlow、DeepSpeed、Megatron-LM、vLLM等至少兩種;
大模型技術(shù):
深入理解Transformer、GPT、LLaMA、Qwen、DeepSeek等主流大模型架構(gòu)及原理;
具備大模型預(yù)訓(xùn)練、SFT、RLHF/DPO/GRPO等微調(diào)技術(shù)的實(shí)踐經(jīng)驗(yàn);
熟悉模型量化(GPTQ/AWQ/GGUF)、推理加速、分布式訓(xùn)練與部署;
智能體與RAG:
熟悉LangChain、LlamaIndex、AutoGen、Dify、Coze等Agent開(kāi)發(fā)框架;
深入理解RAG架構(gòu),熟悉向量數(shù)據(jù)庫(kù)(Milvus、Faiss、PgVector、Elasticsearch等)及Embedding技術(shù);
具備Function Calling、ReAct、CoT等Agent核心范式的開(kāi)發(fā)經(jīng)驗(yàn);
基礎(chǔ)設(shè)施:熟悉Linux環(huán)境、Docker/Kubernetes、GPU集群調(diào)度(Slurm/K8s)、CUDA編程基礎(chǔ);
模型評(píng)估:熟悉大模型評(píng)測(cè)方法(如MMLU、C-Eval、HumanEval等),具備模型效果調(diào)優(yōu)能力。
3. 綜合素質(zhì)要求
具備獨(dú)立解決復(fù)雜技術(shù)問(wèn)題的能力,能夠從零搭建大模型訓(xùn)練或應(yīng)用環(huán)境;
對(duì)前沿技術(shù)有強(qiáng)烈好奇心,能快速跟進(jìn)并實(shí)踐最新研究成果;
具備良好的溝通能力和團(tuán)隊(duì)協(xié)作精神,能將技術(shù)語(yǔ)言轉(zhuǎn)化為業(yè)務(wù)語(yǔ)言;
有技術(shù)博客、開(kāi)源項(xiàng)目貢獻(xiàn)、頂會(huì)論文(NeurIPS/ICML/ACL等)者優(yōu)先。
1. 大模型技術(shù)架構(gòu)與體系建設(shè)
負(fù)責(zé)主流大語(yǔ)言模型(LLM)及多模態(tài)大模型的技術(shù)選型、架構(gòu)設(shè)計(jì)與落地實(shí)施;
搭建和優(yōu)化大模型訓(xùn)練、微調(diào)(Fine-tuning)、推理部署的全鏈路技術(shù)環(huán)境;
設(shè)計(jì)并實(shí)現(xiàn)大模型的高效推理方案,包括模型量化、蒸餾、并行推理、服務(wù)化部署等優(yōu)化策略;
跟蹤并引入業(yè)界前沿的大模型技術(shù)(如MoE、長(zhǎng)上下文、多模態(tài)融合等),推動(dòng)技術(shù)迭代。
2. 智能體(AI Agent)應(yīng)用開(kāi)發(fā)
負(fù)責(zé)智能體應(yīng)用的整體架構(gòu)設(shè)計(jì),包括規(guī)劃(Planning)、記憶(Memory)、工具調(diào)用(Tool Use)、多智能體協(xié)同(Multi-Agent)等核心模塊;
基于LangChain、LlamaIndex、AutoGen、Dify等框架,獨(dú)立開(kāi)發(fā)和落地智能體應(yīng)用;
設(shè)計(jì)并實(shí)現(xiàn)Agent與外部系統(tǒng)(API、數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、業(yè)務(wù)系統(tǒng))的高效集成方案;
探索并落地Agent在自動(dòng)化辦公、智能客服、代碼生成、數(shù)據(jù)分析等場(chǎng)景的應(yīng)用。
3. 大模型應(yīng)用工程化落地
負(fù)責(zé)RAG(檢索增強(qiáng)生成)系統(tǒng)的架構(gòu)設(shè)計(jì)與優(yōu)化,包括向量數(shù)據(jù)庫(kù)選型、Embedding模型優(yōu)化、召回策略設(shè)計(jì)等;
構(gòu)建大模型應(yīng)用的標(biāo)準(zhǔn)化開(kāi)發(fā)流程、模型評(píng)估體系及監(jiān)控運(yùn)維方案;
解決大模型在落地過(guò)程中的性能、穩(wěn)定性、安全性及合規(guī)性問(wèn)題。
4. 技術(shù)攻關(guān)與團(tuán)隊(duì)協(xié)作
獨(dú)立或帶領(lǐng)團(tuán)隊(duì)攻克大模型訓(xùn)練、推理及應(yīng)用中的關(guān)鍵技術(shù)難題;
輸出技術(shù)文檔、***實(shí)踐,推動(dòng)團(tuán)隊(duì)技術(shù)能力提升;
與產(chǎn)品、業(yè)務(wù)團(tuán)隊(duì)緊密協(xié)作,將技術(shù)能力轉(zhuǎn)化為實(shí)際業(yè)務(wù)價(jià)值。
二、任職資格
1. 學(xué)歷與經(jīng)驗(yàn)要求
計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)等相關(guān)專(zhuān)業(yè),本科及以上學(xué)歷(碩士/博士?jī)?yōu)先);
3年以上人工智能相關(guān)研發(fā)經(jīng)驗(yàn),有完整的大模型項(xiàng)目落地經(jīng)驗(yàn);
有大模型訓(xùn)練、微調(diào)或智能體應(yīng)用的實(shí)際上線(xiàn)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
2. 核心技術(shù)能力
編程基礎(chǔ):精通Python,熟悉C 或Go者優(yōu)先;具備良好的代碼規(guī)范和工程化能力;
深度學(xué)習(xí)框架:熟練掌握PyTorch、TensorFlow、DeepSpeed、Megatron-LM、vLLM等至少兩種;
大模型技術(shù):
深入理解Transformer、GPT、LLaMA、Qwen、DeepSeek等主流大模型架構(gòu)及原理;
具備大模型預(yù)訓(xùn)練、SFT、RLHF/DPO/GRPO等微調(diào)技術(shù)的實(shí)踐經(jīng)驗(yàn);
熟悉模型量化(GPTQ/AWQ/GGUF)、推理加速、分布式訓(xùn)練與部署;
智能體與RAG:
熟悉LangChain、LlamaIndex、AutoGen、Dify、Coze等Agent開(kāi)發(fā)框架;
深入理解RAG架構(gòu),熟悉向量數(shù)據(jù)庫(kù)(Milvus、Faiss、PgVector、Elasticsearch等)及Embedding技術(shù);
具備Function Calling、ReAct、CoT等Agent核心范式的開(kāi)發(fā)經(jīng)驗(yàn);
基礎(chǔ)設(shè)施:熟悉Linux環(huán)境、Docker/Kubernetes、GPU集群調(diào)度(Slurm/K8s)、CUDA編程基礎(chǔ);
模型評(píng)估:熟悉大模型評(píng)測(cè)方法(如MMLU、C-Eval、HumanEval等),具備模型效果調(diào)優(yōu)能力。
3. 綜合素質(zhì)要求
具備獨(dú)立解決復(fù)雜技術(shù)問(wèn)題的能力,能夠從零搭建大模型訓(xùn)練或應(yīng)用環(huán)境;
對(duì)前沿技術(shù)有強(qiáng)烈好奇心,能快速跟進(jìn)并實(shí)踐最新研究成果;
具備良好的溝通能力和團(tuán)隊(duì)協(xié)作精神,能將技術(shù)語(yǔ)言轉(zhuǎn)化為業(yè)務(wù)語(yǔ)言;
有技術(shù)博客、開(kāi)源項(xiàng)目貢獻(xiàn)、頂會(huì)論文(NeurIPS/ICML/ACL等)者優(yōu)先。
工作地點(diǎn)
地址:北四環(huán)東路69號(hào)華侖大廈A座1205
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
HR
上海華誼信息技術(shù)有限公司
-
石油·石化·化工
-
200-499人
-
私營(yíng)·民營(yíng)企業(yè)
-
徐家匯路560號(hào)8樓
相似職位
-
互聯(lián)網(wǎng)運(yùn)營(yíng) 5000-8000元1年以上 不限河南鴻蒙谷本食品科技有限公司
-
區(qū)塊鏈工程師 面議5年以上 本科鄭州李唐電子科技有限公司
-
大數(shù)據(jù)開(kāi)發(fā)工程師 10000-15000元2年以上 本科上海大豈網(wǎng)絡(luò)科技有限公司
-
企業(yè)數(shù)字化轉(zhuǎn)型交付與驗(yàn)收專(zhuān)員 7000-10000元應(yīng)屆畢業(yè)生 本科河南天云聚合網(wǎng)絡(luò)科技有限公司
-
智慧城市業(yè)務(wù)經(jīng)理 面議5年以上 大專(zhuān)鄭州航空港區(qū)廣電網(wǎng)絡(luò)服務(wù)有限公司
-
軟件開(kāi)發(fā)工程師 7000-10000元應(yīng)屆畢業(yè)生 本科鄭州易能科技有限公司

2026-05-12 16:35:04
435人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說(shuō)是在河南人才網(wǎng)上看到的。
