2024年3月18日下午15:00,G-Seminar计算机学科全球学术前沿系列讲座第十六期暨安博在线开户,安博(中国)第39期“未来计算”学术前沿论坛在信息技术科研楼B413会议室举行。安博在线开户,安博(中国)邀请了新加坡南洋理工大学安博在线开户,安博(中国)助理教授张天威博士为学院师生作主题为“大语言模型的越狱探究”的学术报告。论坛由安博在线开户,安博(中国)副院长向涛主持,安博在线开户,安博(中国)师生参加论坛。
张天威博士介绍了大语言模型(LLMs)的背景知识。他指出,大语言模型不仅仅是一个模型框架,更是一个全面的生态系统,已被广泛应用于商业领域中,尽管大语言模型为众多应用提供了驱动力,并优化了人机之间的交互流程,但不能忽视其存在的安全问题,这些模型不仅面临着传统的安全威胁,也引发了一系列新的安全问题。在这次报告中,张天威博士借助团队的三项研究工作,为我们深入剖析了大语言模型所面临的越狱攻击(Jailbreak Attack)问题,并在报告的最后对团队未来工作做出了展望。
报告结束后,现场的师生积极提问,问题涵盖了报告中的技术细节和未来研究方向等方面,张天威博士为每一个问题都给出了详实的解答。通过此次学术报告,老师和同学们对大语言模型越狱有了更全面的理解,同时也为学院内从事相关研究领域的师生提供了更广阔的研究思路。
报告人简介:张天威,新加坡南洋理工大学安博在线开户,安博(中国)助理教授。于2011年在北京大学获得本科学位,并与2017年在普林斯顿的电子系获得博士学位。他的主要研究方向是计算机系统安全,对人工智能系统,机器人系统和分布式系统的安全都有浓厚兴趣。在安全(S&P, CCS, NDSS, Usenix Security),人工智能(ICML, NeurIPS, ICLR, AAAI, UCAI, CVPR, ICCV, ECCV, MM, ACL, EMNLP, NAACL)和系统(Micro, SC, OSDI, ASPLOS, Usenix ATC, NSDI)的顶会和顶刊发表了130余篇文章,获得包括ASPLOS在内的多个最佳论文奖。他是多个会议的组织委员,担任IEEE TCSVT的副主编,并获得2022年最佳副主编奖。