点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:集语料、聚人才、拓场景 打造东盟语言AI基地
首页> 地方频道> 地方频道-广西> 要闻 > 正文

集语料、聚人才、拓场景 打造东盟语言AI基地

来源:广西云-广西日报2025-08-11 10:26

  本期讨论主题:广西如何建设东盟语言AI基地?

  广西民族大学东南亚语言文化学院译审,亚非语言文学、翻译专业硕士研究生导师黎巧萍:

  广西是我国面向东盟开放合作的前沿和窗口,积极服务构建中国—东盟命运共同体。建设东盟语料库与语言AI基地,是深化区域合作、实现数字化转型的关键。基于专业经验和实践,建议从三方面推进:

  一、构建中文—东盟语言双语平行语料库,夯实数据基础

  双语平行语料库是机器翻译、跨语言信息检索等技术的核心资源。广西可发挥拥有丰富的东盟语料基础的优势,联合高校、科研机构及企业建立“政府主导+市场参与”机制,重点整合越南语、泰语、老挝语等东盟主要语种在商贸、法律、医学等领域的语料。通过Tmxmall等工具创建TMX格式双语对齐语料库,确保语料质量,按需采购医学、游戏本地化等专业领域语料,弥补稀缺资源缺口。同时构建“基础通用+专业领域”分层分类语料库,针对跨境电商、工程建设等场景标注专业语料,依托共享平台推动合规开放,提升资源利用效率。

  二、推进语料标注标准化,保障数据质量与安全

  语料标注是AI模型训练的基础,需兼顾技术效能与安全合规。应明确功能性与安全性双重标注目标,既要确保语料真实准确、标注专业术语及文化适配内容,又要依规防范数据偏见、文化冲突等问题,确保模型输出符合伦理规范。优化标注流程与质量管控,采用“人工+AI”混合标注模式,提升效率,确保标注准确性。加强标注人员培训,尤其注重东盟小语种人才培育,解决细分领域人才短缺问题。

  三、打造东盟语言AI基地,推动技术应用与产业融合

  以技术创新为核心构建全链条生态,在中心城市设立语言AI创新基地,研发适配东盟市场的AI工具;联合东盟国家共建实验室,开展语料标准对接与技术攻关。推进场景化应用与产业协同,在边境口岸等试点部署语言AI终端,提供实时翻译等服务,提升跨境贸易效率。培育本土语言AI企业,探索输出模式,为中国企业“走出去”提供支持。

  通过构建高质量语言服务体系,广西可将区位优势转化为发展动能,为中国—东盟数字化合作提供支撑,助力区域高质量发展。

  广西社会科学院老挝研究中心主任、研究馆员谢柱军:

  目前,广西正将人工智能作为推动区域经济高质量发展的重要引擎,聚力打造面向东盟的人工智能合作高地。发展人工智能,需规避同质化、内卷化竞争,走出一条具有广西特色的高质量发展之路。

  广西毗邻东盟,文化相近,语言相通,在语言、人文交流等方面优势显著,东盟小语种人才储备充足,建设东盟语料库条件优越。广西依托此优势建设东盟语言AI基地,可让东盟语言文字数据资源发挥“点石成金”之效,助力广西成为中国人工智能企业走向东盟的枢纽节点、双方资源要素汇聚的前沿。

  巩固“点石成金”的基础,打造功能齐全的东盟语料库。建议以中国—东盟人工智能创新合作中心、中国—东盟信息港等为依托,统筹全区东盟语料库建设,发挥好南宁等设区市“语料券”“算力券”的投资引导作用,深化与东盟各国的人工智能合作,完善科学公正的数字经济交易规制与平台,撬动人工智能投资增长,夯实语料库基础。

  汇聚“点石成金”的人才,丰富东盟语言人才资源。柔性引进AI领域权威专家,组建差异化专家团队服务基地建设。继续深化与东盟国家的教育合作,有针对性地增加相关小语种人才培养,为在校东盟小语种专业学生增设AI课程,培育适应AI专业工作需要的复合型人才,形成面向东盟的人工智能产业集群,打造中国人工智能企业走进东盟的“桥头堡”。

  创造“点石成金”的机会,构建多模态人工智能应用场景。务实开发建设各类东盟人工智能应用场景,扩大东盟语料库的应用范围。以提高东盟小语种机器翻译准确率为重点,扩大低资源语言的语料库规模,优化算法模型,不断提升机器翻译的可信度。推动东盟语料库与机器人研发结合,打造具有广西特色的东盟机器人语料库。

  广西应牢牢把握新行业、新赛道、新领域高质量发展的时代需求,准确把握AI基地建设的需要,敢为天下先,紧跟AI产业潮流,建设好东盟语言AI基地。

  (广西云-广西日报记者杨思悦/整理)

[ 责编:王文韬 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 世界机器人大会周末人气旺

  • “动车医生”战高温斗酷暑 为暑运保驾护航

独家策划

推荐阅读
中国科学院上海天文台科研人员最近在引力波天文学领域取得了突破性发现:双黑洞并合事件可能发生在第三个致密天体的“眼皮子底下”。
2025-08-11 09:56
日前从安徽省林业局获悉,安徽扬子鳄野外种群数量创历史新高。监测数据显示,截至2025年7月20日,扬子鳄国家级自然保护区扬子鳄产卵超3800枚,扬子鳄野外种群数量超1920条。
2025-08-11 09:53
近年来,我们团队聚焦海洋多场环境耦合机制、多体结构相互作用、多尺度耦合效应等难题,开展深度产学研用合作,研发多款海工装备。
2025-08-11 09:45
在医学和生物技术领域,实现蛋白质定向进化,使其具有新功能或改进功能至关重要。为此,美国斯克利普斯研究所的科学家开发了一个可以加速蛋白质进化的合成生物学平台T7-ORACLE。
2025-08-11 09:43
近日,科学信息分析公司爱思唯尔与香港浸会大学联合发布《传承与创新:解码中医药科学发展轨迹》报告。
2025-08-11 09:41
实验室是科技创新的重要摇篮,但里边有不少危险而又昂贵的设备,可能对科研工作者人身和财产安全造成威胁。如何织密安全防护网?
2025-08-08 10:25
中国科学技术大学俞书宏院士团队成功开发出一种可闭环生物回收的纤维素基介电薄膜,能够提高电子器件的循环利用率,从而减少电子废弃物。
2025-08-08 10:16
日前,济南量子技术研究院团队与深圳国际量子研究院团队合作,在可见光集成光学领域取得重要进展:成功研制出一套新型可见光矢量光谱分析仪。
2025-08-08 10:12
中国林科院林业所林木细胞遗传研究组近日提出了研究裸子植物生长停滞可塑性的独特模型。这一成果填补了人们对裸子植物发育可塑性认识的空白。
2025-08-08 10:11
8月6日,揽月月面着陆器着陆起飞综合验证试验在位于河北省怀来县的地外天体着陆试验场圆满完成,此次试验是我国首次进行载人航天器地外天体着陆起飞试验。
2025-08-08 10:09
近日,中国科学院大连化学物理研究所研究员吴凯丰团队采用胶体量子点溶液作为增益介质,通过法布里-珀罗谐振腔耦合及双脉冲泵浦设计,开发出连续稳定工作10天以上、能量转化效率大于17%的量子点液体激光器。
2025-08-07 10:18
近日,中国农业科学院农业基因组研究所的研究团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。
2025-08-07 10:18
无论是钢琴家指尖流淌出的动人旋律,还是外科医生在显微镜下的精准操作,甚至是母亲为孩子系鞋带时的温柔细致……
2025-08-07 03:40
月球,地球最亲密的邻居,它的“婴儿期”是什么样的?为破解这个谜题,中国地质大学(北京)科学研究院王水炯教授团队和中国科学院地质与地球物理研究所李秋立研究员团队合作
2025-08-07 03:40
近日,国务院常务会议讨论并原则通过了《中华人民共和国耕地保护和质量提升法(草案)》(以下简称《草案》),决定将《草案》提请全国人大常委会审议。
2025-08-07 03:40
长期以来,石油衍生塑料的污染问题,特别是微塑料对食物和水源的有害影响,一直困扰着人类。研究人员设计了利用恶臭假单胞菌等菌株,将二氧化碳、木质素和食物垃圾等废物转化为生物塑料的方法。
2025-08-06 09:38
南方科技大学地球与空间科学系副教授林玉峰与合作者揭示了地球磁场发电机对地核流体黏度的不变性,并发现早期地球模型可产生与现今观测高度相似的地磁场结构和强度。
2025-08-06 09:35
中国工程院院士、中国农业科学院作物科学研究所研究员万建民表示,纹枯病是威胁全球水稻生产的重大病害,年均造成产量损失10%至30%。
2025-08-06 09:33
近年来,受全球气候变化影响,灾害性天气的突发性、极端性、不确定性愈加明显,特别是进入汛期,突破历史纪录和传统认知的灾害频繁发生。
2025-08-06 09:25
农业农村部、生态环境部日前联合发布《中国渔业生态环境状况公报(2024)》,公布2024年中国渔业水域水质、沉积物、浮游生物等18项指标的生态环境监测情况。
2025-08-06 09:22
加载更多