大模型方向

大模型研究及应用团队,是齐鲁师范学院人工智能教育研究院的核心研究方向之一。团队专注于大模型的前沿理论研究、关键技术攻关与教育场景创新应用。我们致力于构建面向教育领域的专用大模型,并深入探索其在新一代智慧教育系统中的赋能作用,旨在通过大模型技术推动教育教学的智能化变革。

研究方向

本团队的研究贯穿大模型的全技术栈,重点聚焦于:

1.教育大模型的构建与优化: 研究大模型的预训练、有监督微调(SFT)、基于人类反馈的强化学习(RLHF)等全流程技术,重点攻克教育领域知识的高效注入与对齐难题。

2.大模型的多模态推理与生成: 探索大模型对文本、语音、图像等多模态教育数据的理解、推理与生成能力,重点应用于开放式问答、复杂解题步骤生成、多模态作业智能批改等场景。

3.大模型驱动的教育智能体: 研发基于大模型的个性化学习伴侣与教学辅助智能体,实现自适应对话、认知状态诊断与精准学习路径规划。


学术竞赛成果


研究人员

————————————————————————————————————————————————————————————

李成飞

部门:齐鲁师范学院人工智能教育研究院

方向:大模型方向

学位:硕士学位


  个人信息                                                                                                                   

李成飞,毕业于兰州大学,现任职于齐鲁师范学院人工智能教育研究院,曾担任智慧教育国家新一代人工智能开放创新平台数据算法工程师、高级语音算法工程师、大模型资深算法工程师等职务,拥有7年AI教育研发经验。主导多个语音识别和多模态作业批改大模型项目。曾获Interspeech“非母语儿童语音识别挑战赛”冠军、第一届国家智慧教育平台数据创新应用活动杰出作品、创新作品奖。在Interspeech、AAAI、EMNLP、ISCSLP、APSIPA、CCL等人工智能领域顶级会议与期刊上发表多篇学术论文10余篇,国内外授权发明专利20余项。

  研究兴趣                                                                                                                   

大模型、教育数据挖掘、人工智能教育、多模态深度学习

  科研项目                                                                                                                   

2020/07-2024/06 科技创新2030-新一代人工智能重大项目 - 智慧教育人工智能开放创新平台

  学术竞赛                                                                                                                   

带领团队获得 INTERSPEECH 2021“非母语儿童语音识别”世界比赛冠军

CCL25-Eval任务五-第一届中文古诗词赏析评测:二等奖

国家智慧教育平台-题目一-精品课视频资源分析:创新作品

国家智慧教育平台-题目二-多模态试题知识点标签预测:杰出作品

国家智慧教育平台-题目三-教学课件内容识别与分类:创新作品

CCAC2025第五届中国情感计算大会技术评测-中国多模态讽刺计算:二等奖

CCAC2025第五届中国情感计算大会技术评测-细粒度比拟句情绪分析:三等奖

CCAC2025第五届中国情感计算大会技术评测-四格漫画理解评测-四格漫画上下文推理:优胜奖

AIRS-2025开发大赛「星际矿脉」火星矿物高光谱分类挑战赛:优秀奖

CCL25-Eval任务9-中医辨证辨病及中药处方生成评测:第十名

2025年“数据要素x”大赛山东分赛济南市选拔赛:二等奖

智源行业数据应用大模型挑战赛-旅游数据赛道:第七名

山东省大学生人工智能天赛暨计算智能应用挑战赛:二等奖

  学术服务                                                                                                                   

2022年 ISCSLP2022 MAGICHUB中英混语音识别挑战赛评委专家

  授权专利                                                                                                                   

一种教学场景下的语言模型在线增量自适应方法,CN113096646B(国际专利申请中)

一种语音合成中多模型联合优化的汉字转拼音方法,CN111737957B

一种教学场景下多科目语音识别神经网络语言模型自适应方法,CN111816171B

一种基于字建模的多任务学习中文文本韵律结构预测方法,CN112017628B

一种教学场景下端到端英文课堂语码转换语音识别方法,CN112133287B

一种基于跨维度混合特征的分级语音识别结果检错及纠错方法,CN112599129B

一种基于解耦Transformer的中英文混合语音识别方法,CN112668704B

一种教学场景中基于语种分类敏感的端到端中英文混合语音识别方法,CN112951240B

一种联合语种信息的端到端中英文混合语音识别方法,CN113077781B

一种基于置信度敏感的端到端语音识别二遍解码方法,CN112767926B

一种线下一对一教学场景中的多模态语音识别置信度方法,CN113314099B

一种线下教学场景中的说话人身份识别及语音识别方法,CN113257230B

一种基于IPA的Mask-CTC非自回归中英文混合语音识别方法,CN113299282B

一种教学场景下音节汉字混合建模的关键词语音识别方法,CN115527523A

一种结合统计特征与字串组合概率的词表构建方法,CN111831832B

一种教学场景下的动态发音人感知及个性化参考发音生成方法,CN111930900B

一种强噪声环境下的鲁棒语音识别方法,CN112634908B

一种基于身份特征嵌入及多任务学习的教育场景语音识别系统构建方法,CN112599117B

一种基于动态韵律表征的个性化语音合成方法,CN113096638B

一种基于动态情感模仿的个性化语音合成方法,CN113257220B

一种基于发音质量的儿童语音评测系统,CN 113035238B

  学术论文                                                                                                                   

1.Li C, Deng S, Wang Y, et al. TALCS: An Open-Source Mandarin-English Code-Switching Corpus anda Speech Recognition Baseline[J]. CoRR (accepted at Interspeech 2022), vol. abs/2206.13135, 2022.

2.F. Zhang, C. Li, S. Deng, Y. Wang and J. Bai, "Hybrid Syllable and Character Representations for Mandarin ASR," 2023 Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Taipei, Taiwan, 2023, pp. 1949-1954. (通讯作者)

3.Deng S, Li C, Bai J, et al. Summary on the iscslp 2022 chinese-english code-switching asr challenge[C]//2022 13th International Symposium on Chinese Spoken Language Processing (ISCSLP). IEEE, 2022: 527-531.  (通讯作者)

4.Wen J, Ke P, Sun H, et al. Unveiling the Implicit Toxicity in Large Language Models[J]. arXiv preprint arXiv:2311.17391, 2023.(accepted at EMNLP 2023)

5.Zeping Min,Jinfeng Bai,Chengfei Li. Leveraging Local Variance for Pseudo-Label Selection in Semi-supervised Learning.(accepted at AAAI-24)

6.Chengfei Li, Li Liu and Fan Jiang. Intelligent Question Answering Model    Based on CN-BiLSTM, Proceedings of the 2018 2nd International Conference on Computer Science and Artificial Intelligence. ACM, 2018: 447-450.

7.Xu G, Yang S, Ma L, Li C, et al. The TAL System for the INTERSPEECH2021 Shared Task on Automatic Speech Recognition for Non-Native Children Speech[J].  Proc. Interspeech 2021, 2021:1294- 1298.

8.Zhang Qiang, Liu Li, Li Chengfei, Jiang Fan. Moth-flame optimization algorithm based on adaptive weight and simulated annealing, 8th International Conference on  Intelligence Science and Big Data Engineering, IScIDE 2018.

9.Li Y J, Zhang X, Wan K, et al. Prompt-Guided Mask Proposal for Two-Stage Open-Vocabulary Segmentation[J]. arXiv preprint arXiv:2412.10292, 2024. 

10.Decision notification for your submission 6: System Report for CCL25-Eval Task 5: Data Augmentation and Large Language Model Fine Tuning for Chinese Ancient Poetry Comprehension and Inference

  项目经历                                                                                                                   

全球最大中英文混合识别数据集及系统主要贡献者

智慧教育-国家新一代人工智能开放平台-智能语音交互方向主要承建者


————————————————————————————————————————————————————————————

曹太合

部门:齐鲁师范学院人工智能教育研究院

方向:大模型方向

学位:博士学位


  个人信息                                                                                                                   

曹太合,人工智能教育研究院青年讲师,博士毕业于华中师范大学人工智能教育学部,教育信息技术专业,硕博连读,德国柏林洪堡大学计算机科学与教育学院联合培养博士,北京师范大学教育学部教育技术学院博士后。研究方向为AI支持的自我调节学习,教育数据挖掘和学习分析、人工智能赋能教学设计,研究内容获得第73批中国博士后面上项目及国家资助博士后研究计划(C档)的资助,研究成果发表在Interactive Learning Environments、《中小学信息技术教育》、全球华人计算机教育应用大会、教育技术国际论坛等期刊和会议上。

  学术论文                                                                                                                   

[1] Cao Taihe , Zhang Zhaoli , Chen Wenli & Shu Jiangbo.Utilizing clickstream data to reveal the time management of self-regulated learning in a higher education online learning environment[J].Interactive Learning Environments, 2022.DOI:10.1080/10494820.2022.2042031.

[2] Zhang Zhaoli , Cao Taihe , Shu Jiangbo & Liu Hai.Identifying key factors affecting college students' adoption of the e-learning system in mandatory blended learning environments[J].Interactive Learning Environments, 2020(2):1-14.DOI:10.1080/10494820.2020.1723113.

[3] 武法提,曹太合,郑颢琳.基于专注度识别的作业分心干预策略研究[J].中小学信息技术教育, 2025(7).

[4] Cao Taihe, Wu Fati , Shu Jiangbo & Chen Weijia (2024.06). Recognizing learners based on time management images in the process of self-regulated learning, GCCCE 2024.

[5] Shao Jinsha, Zhang Zhaoli & Taihe Cao* (2018.11). Exploring key factors affecting students adoption of e -learning system in higher education, IFET 2018.

————————————————————————————————————————————————————————————

吴悦

部门:齐鲁师范学院人工智能教育研究院

方向:大模型方向

学位:硕士学位


 个人信息                                                                                                                  

吴悦,计算机科学与技术硕士,讲师,主要从事人工智能、计算机视觉(大规模图像分类和检索)、时序数据分析等方面的研究,目前已在国、内外核心期刊发表相关论文5篇,参与省自然科学基金(面上项目)1项,获得国家授权专利2项。

 授权专利                                                                                                                  

一种基于高阶深度哈希学习的图像检索方法, CN109241313B

一种基于MES系统实现成型、硫化自动排产系统, CN112862308B

 学术论文                                                                                                                  

[1] Yue Wu, Qiule Sun, Jianxin Zhang, et al. Deep covariance estimation hashing for image retrieval[C]. 2019 IEEE International Conference on Image Processing (ICIP). IEEE, 2019: 2234-2238.(Oral, TOP 10 Paper)

[2] Yue Wu, Qiule Sun, Yaqing Hou,et al. Deep covariance estimation hashing[J]. IEEE Access, 2019, 7: 113223-113234.

[3] Bin Liu, Yue Wu. Co-evolution of reputation-based preference selection and resource allocation with multigame on interdependent networks[J]. Applied Mathematics and Computation, 2023, 456: 128128.

[4] Qian Wang, Yue Wu, Jianxin Zhang, et al. Supervised Deep Second-Order Covariance Hashing for Image Retrieval[C]. Data Science: 6th International Conference of Pioneering Computer Scientists, Engineers and Educators, ICPCSEE 2020, Taiyuan, China, September 18-21, 2020, Proceedings, Part I 6. Springer Singapore, 2020: 476-487.

[5] 张建新,吴悦,张强等.有监督相似性保持的深度二阶哈希方法[J].计算机科学,2022,49(S2):494-501.

 科研项目                                                                                                                  

图像高阶深度特征表达方法及其应用研究, 辽宁省自然科学基金资助计划项目(面上项目), 2019.10-2021.9.

[2]齐鲁师范学院教改课题《人工智能助推师范生培养研究》



Copyright© 2021 All Rights Reserved. 齐鲁师范学院人工智能产业学院版权所有