点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
本期讨论主题:广西如何建设东盟语言AI基地?
广西民族大学东南亚语言文化学院译审,亚非语言文学、翻译专业硕士研究生导师黎巧萍:
广西是我国面向东盟开放合作的前沿和窗口,积极服务构建中国—东盟命运共同体。建设东盟语料库与语言AI基地,是深化区域合作、实现数字化转型的关键。基于专业经验和实践,建议从三方面推进:
一、构建中文—东盟语言双语平行语料库,夯实数据基础
双语平行语料库是机器翻译、跨语言信息检索等技术的核心资源。广西可发挥拥有丰富的东盟语料基础的优势,联合高校、科研机构及企业建立“政府主导+市场参与”机制,重点整合越南语、泰语、老挝语等东盟主要语种在商贸、法律、医学等领域的语料。通过Tmxmall等工具创建TMX格式双语对齐语料库,确保语料质量,按需采购医学、游戏本地化等专业领域语料,弥补稀缺资源缺口。同时构建“基础通用+专业领域”分层分类语料库,针对跨境电商、工程建设等场景标注专业语料,依托共享平台推动合规开放,提升资源利用效率。
二、推进语料标注标准化,保障数据质量与安全
语料标注是AI模型训练的基础,需兼顾技术效能与安全合规。应明确功能性与安全性双重标注目标,既要确保语料真实准确、标注专业术语及文化适配内容,又要依规防范数据偏见、文化冲突等问题,确保模型输出符合伦理规范。优化标注流程与质量管控,采用“人工+AI”混合标注模式,提升效率,确保标注准确性。加强标注人员培训,尤其注重东盟小语种人才培育,解决细分领域人才短缺问题。
三、打造东盟语言AI基地,推动技术应用与产业融合
以技术创新为核心构建全链条生态,在中心城市设立语言AI创新基地,研发适配东盟市场的AI工具;联合东盟国家共建实验室,开展语料标准对接与技术攻关。推进场景化应用与产业协同,在边境口岸等试点部署语言AI终端,提供实时翻译等服务,提升跨境贸易效率。培育本土语言AI企业,探索输出模式,为中国企业“走出去”提供支持。
通过构建高质量语言服务体系,广西可将区位优势转化为发展动能,为中国—东盟数字化合作提供支撑,助力区域高质量发展。
广西社会科学院老挝研究中心主任、研究馆员谢柱军:
目前,广西正将人工智能作为推动区域经济高质量发展的重要引擎,聚力打造面向东盟的人工智能合作高地。发展人工智能,需规避同质化、内卷化竞争,走出一条具有广西特色的高质量发展之路。
广西毗邻东盟,文化相近,语言相通,在语言、人文交流等方面优势显著,东盟小语种人才储备充足,建设东盟语料库条件优越。广西依托此优势建设东盟语言AI基地,可让东盟语言文字数据资源发挥“点石成金”之效,助力广西成为中国人工智能企业走向东盟的枢纽节点、双方资源要素汇聚的前沿。
巩固“点石成金”的基础,打造功能齐全的东盟语料库。建议以中国—东盟人工智能创新合作中心、中国—东盟信息港等为依托,统筹全区东盟语料库建设,发挥好南宁等设区市“语料券”“算力券”的投资引导作用,深化与东盟各国的人工智能合作,完善科学公正的数字经济交易规制与平台,撬动人工智能投资增长,夯实语料库基础。
汇聚“点石成金”的人才,丰富东盟语言人才资源。柔性引进AI领域权威专家,组建差异化专家团队服务基地建设。继续深化与东盟国家的教育合作,有针对性地增加相关小语种人才培养,为在校东盟小语种专业学生增设AI课程,培育适应AI专业工作需要的复合型人才,形成面向东盟的人工智能产业集群,打造中国人工智能企业走进东盟的“桥头堡”。
创造“点石成金”的机会,构建多模态人工智能应用场景。务实开发建设各类东盟人工智能应用场景,扩大东盟语料库的应用范围。以提高东盟小语种机器翻译准确率为重点,扩大低资源语言的语料库规模,优化算法模型,不断提升机器翻译的可信度。推动东盟语料库与机器人研发结合,打造具有广西特色的东盟机器人语料库。
广西应牢牢把握新行业、新赛道、新领域高质量发展的时代需求,准确把握AI基地建设的需要,敢为天下先,紧跟AI产业潮流,建设好东盟语言AI基地。
(广西云-广西日报记者杨思悦/整理)