top
请输入关键字
先进制造与机器人系研究员
新奥工学青年杰出学者
电子邮箱:hsf@pku.edu.cn
工作经历:
2024.08至今,33678新甫京国际品牌,研究员
2023.05 – 2024.06,自由量级(北京)智能科技有限公司,联合创始人/高级副总裁
2020.01 – 2023.05,阿里巴巴达摩院,资深算法专家/技术总监
2011.12 – 2020.01,IBM中国研究院,资深研究员/研究经理/院长助理
2009.11 – 2011.10,美国IBM T.J.沃森研究中心,博士后研究员 ,合作导师:周伯文
教育经历:
2005.09 – 2010.06,英国爱丁堡大学,人工智能,获得哲学博士学位,导师:Steve Renals
2002.09 – 2005.07,33678新甫京国际品牌信息科学技术学院,信号与信息处理,获得理学硕士学位
1998.09 – 2002.07,华北电力大学自动化系,自动控制,获得工学学士学位
研究领域:
主要研究方向是人工智能大模型技术的研发和应用,具体包括大模型核心算法、行业大模型和具身智能等。
1. 大模型核心算法研发:研究大小模型协同、多模态融合、合成数据训练、推理加速、知识融合等前沿技术。
2. 行业大模型应用:专注于能源领域的大模型开发,探索行业数据构建、异构数据融合和行业模型训练框架等。
3. 具身智能:开发具身多模态大模型,研究“感知-认知-执行”一体化端到端的具身机器人大脑系统。
荣誉奖励:
2021年获得国际医疗资讯协会IMIA最佳NLP论文奖
2021年获得阿里巴巴最高技术奖“达摩奖”
2021年获得世界人工智能大会SAIL奖TOP 30
2018年获得IBM杰出技术成果奖
2018年获得IBM研究部门成就奖
2017年获得IBM杰出技术成果奖
2010年获得国际语音声学会议ICASSP最佳论文奖
评测比赛:
2023年,多语言语言模型VECO 在XTREME 榜单上目前平均分85.8,排名第一
2022年,中文语言理解评测基础CLUE Benchmark 中排名第一,首次超越人类结果
2021年,多模态模型mPLUG 在视觉问答VQA 挑战赛中排名第一,首次超越人类结果
2021年,医疗摘要,在MEDIQA 2021 问题摘要评测任务中排名第一
2020年,通用语言模型StructBERT 在GLUE Benchmark 目前平均分90.6,排名第一
2020年,生成式语言模型PALM 在MSMARCO 自然语言生成和智能摘要上排名第一
2020年结构化语言模型Structural-LM 在FUNSD、RVL-CDIP、DocVQA 三个数据集排名第一
2020年,机器阅读理解模型UED 在MSMARCO 篇章排序榜单上排名第一
2020年,医疗检索,在TREC精准医疗评测的16只队伍的66次提交中以明显优势排名第一
招聘信息:
长期招收本科生、硕士/博士研究生、博士后、工程师。欢迎具有扎实数理基础、良好编程动手能力、对上述研究领域感兴趣的同学加入团队。
部分论文列表:

发表的文章共计85篇,包括14篇国际期刊和71篇国际会议论文;Google Scholar论文引用量3900+h-index 31;获得专利授权14项,专利公布35项。

Google Scholar:https://scholar.google.com/citations?user=3So9lV8AAAAJ&hl=en

DBLP:https://dblp.org/pid/05/4919.html

 

代表性论文:


  • Runxin Xu&, Fuli Luo, Zhiyuan Zhang, Chuanqi Tan, Baobao Chang*, Songfang Huang*, Fei Huang. “Raise a child in large language model: Towards effective and generalizable fine-tuning,” in Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, EMNLP 2021, November 7-11, 2021
  • Xiaoyang Sun&, Wei Wang, Shenghao Qiu, Renyu Yang, Songfang Huang*, Jie Xu, Zheng Wang*. “STRONGHOLD: fast and affordable billion-scale deep learning model training,” in SC22: International Conference for High Performance Computing, Networking, Storage and Analysis, Dallas, TX, USA, November 13-18, 2022
  • Guixin Ye, Zhanyong Tang*, Shin Hwei Tan, Songfang Huang*, Dingyi Fang, Xiaoyang Sun, Lizhong Bian, Haibo Wang, Zheng Wang*, “Automated conformance testing for javascript engines via deep compiler fuzzing,” in PLDI ’21: 42nd ACM SIGPLAN International Conference on Programming Language Design and Implementation, Virtual Event, Canada, June 20-25, 2021
  • Jiebin Chu&, Yaoyun Zhang, Fei Huang, Luo Si, Songfang Huang*, Zhengxing Huang*, “Disentangled representation for sequential treatment effect estimation,” Computer Methods and Programs in Biomedicine (CMPB), vol. 226, p. 107175, 2022.
  • Songfang Huang, Steve Renals. “Power law discounting for n-gram language models,” in Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, Sheraton Dallas Hotel, Dallas, Texas, USA, 14-19 March 2010, IEEE, 2010, pp. 5178–5181
  • Songfang Huang and Steve Renals, “Hierarchical bayesian language models for conversational speech recognition,” IEEE Trans. Speech Audio Process., vol. 18, no. 8, pp. 1941–1954, 2010
  • Jinkun Zeng, Yaoyun Zhang, Yutao Xiang, Sugai Liang, Chuang Xue, Junhang Zhang, Ya Ran, Minne Cao, Fei Huang, Songfang Huang, Wei Deng*, Tao Li*. “Optimizing multi-domain hematologic biomarkers and clinical features for the differential diagnosis of unipolar depression and bipolar depression,” npj Mental Health Research, vol. 2, no. 1, p. 4, April 2023
  • Menglin Lu, Yaoyun Zhang, Junhang Zhang, Songfang Huang, Fei Huang, Tingna Wang, Fei Wu, Hongjing Mao, Zhengxing Huang, “Comparative effectiveness of digital cognitive behavioral therapy vs medication therapy among patients with insomnia,” JAMA Network Open, vol. 6, no. 4, pp. e237 597–e237 597, 04 2023
  • Hongyi Yuan&, Zheng Yuan, Chuanqi Tan, Wei Wang, Songfang Huang, Fei Huang. “RRHF: rank responses to align language models with human feedback without tears,” in Thirty-seventh Conference on Neural Information Processing Systems (NeurIPS), November, 2023
  • Qiao Jin&, Zheng Yuan, Guangzhi Xiong, Qianlan Yu, Huaiyuan Ying, Chuanqi Tan, Mosha Chen, Songfang Huang, Xiaozhong Liu, Sheng Yu, “Biomedical question answering: A survey of approaches and challenges,” ACM Computing Surveys (CSUR), vol. 55, no. 2, pp. 35:1–35:36, 2023