语言智能系列讲座第一讲：构建大语言模型开放评测体系

2023年12月05日点击：[]

12月4日下午，天津大学智能与计算学部教授、博士生导师，自然语言处理实验室负责人，天津市“一带一路”联合实验室语言智能与技术中外联合研究中心主任熊德意教授应邀于我校长安校区图书馆S614为校内师生作了题为“构建大语言模型开放评测体系”的讲座。此次讲座由外国语言文学研究院米成刚副教授主持。

熊教授从人类文明发展史出发，指出AI大语言模型是迈向人类智能文明的拐点。它在重塑社会和科学技术发展的同时，也存在诸如生成内容不真实，前后不一致，具有误导性，包含歧视、偏见和泄露他人隐私等多种风险。因此，构建开放式的大语言模型评测体系已成为该领域发展亟需开展的工作。熊教授基于对相关研究工作的梳理，从知识和能力测评、对齐评测、安全评测、行业大模型评测、综合评测等多个维度，详细论述了大语言模型评测-分类框架。在梳理和介绍现有的大模型评测方法的基础上，熊教授探讨了其中存在的瓶颈问题及大模型评测在风险评估、Agent评估、动态评估等方面未来的发展方向。

讲座后期，熊教授与到场师生进行了深入交流，并针对在场师生在使用大语言模型进行语言研究等方面遇到的问题及困惑给予了耐心地解答。

近年来，我院立足教师的学科优势，聚焦人工智能与语言研究前沿问题，不断提升语言研究的创新式发展。本次讲座是语言智能系列的首场讲座，也是我院开展学科交叉融合的重要实践。

上一条：语言学系列讲座第十四讲：时间性与情态的相互关系

下一条：翻译与语料库研究系列讲座第十讲规范-描述-阐释翻译学：翻译学的研究的现状与未来

【关闭】

学术讲座

语言智能系列讲座第一讲：构建大语言模型开放评测体系

联系我们

学术讲座

语言智能系列讲座 第一讲：构建大语言模型开放评测体系

联系我们

语言智能系列讲座第一讲：构建大语言模型开放评测体系