【法·欧洲时报网】中国初步建成大规模藏语数据资源库
2024-10-09 15:41:01
来源: 中国新闻网
(相关资料图)
从青海师范大学省部共建藏语智能信息处理及应用国家重点实验室获悉,该实验室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。
青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室。实验室拥有5000平方米的科研用房和1.5亿元人民币的专业研发设备。
该实验室主任赵海兴介绍,近年来,实验室构建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上,藏语语音数据15000小时、各类文化资源近2万件,规模达到1600GB,是目前国内外最大的基于国标的大型标注语料库,对中国涉藏地区教育、语言研究以及社会文化发展起到积极推动作用。
同时,该实验室还构建了大规模藏汉平行语料库,并通过迭代式回译策略等进行数据增强及质量评价,训练了融合单语语言模型和注入双语词典信息的深度神经网络翻译模型,在新闻、法律等领域准确率达90%以上。
此外,该实验室还搭建藏文文献资源数字化协同工作平台,构建文献图文对照数据150余万文本行,复杂场景图文资源220万个,开展藏文印刷字体、复杂场景藏文区域检测研究,自动检测视频帧中的文字区域,并将其分割成单个字符或行文本。利用深度学习对分割处理后的文本进行识别,实现了藏文文献标准体和手写体扫描识别系统、藏语视频流复杂场景中的藏文识别。
为您推荐
热门文章
新动态:西宁国家级中小企业特色产业集群实现零的突破
广西“政银合作”助力私营企业发展壮大 最新消息
当前热门:北京住房公积金管理中心:京籍二孩以上家庭最高可贷到160万元
全球快看点丨戴德梁行:2024年北京零售市场新增供应有望达近十年来最高
南阳市公共场所卫生监督示范区现场经验交流会在邓州市召开
上期年化什么意思?理财年化收益率是什么意思?
德国机器人市场持续增长,稳居欧洲榜首
巴沙鱼是可以吃的吗?巴沙鱼好还是龙利鱼好?
炎陵县共襄盛举:海峡两岸炎帝神农文化交融新篇章
国庆假期观礼天安门广场升国旗仪式须提前预约 全球新消息
天天速读:青春华章|105岁南开的教育魅力
国家能源局:截至8月底全国累计发电装机容量同比增长14.0% 世界快消息
精彩图片
-
【法·欧洲时报网】中国初步建成大规模藏语数据资源库
-
上海出新政放宽应届生身份认定标准-焦点快播
-
“中国绿色大豆之都”大豆收获全面告捷 最高亩产598.7斤创纪录-全球今头条
-
全球新消息丨精彩连连,看点不断!国庆假期文旅大餐“村趣”无限引客来
-
(身边的变化)“一双鞋”的二次创业路
-
9月30日全社会跨区域人员流动量超2.2亿人次
-
中国发布37项国家计量技术规范 涉铁路交通等领域
-
波司登携手机能教父Errolson Hugh,重塑机能户外新风尚_当前讯息
-
郑州住房公积金管理中心:10月8日起面向存量住房开展组合贷款业务_世界热闻
-
全球今日报丨打造“健康汽车”,2024“零甲醛”汽车技术研讨活动亮成果
-
天天日报丨玫红色搭配什么颜色好看?玫红色怎么穿不土气?
-
2024年全国科普日长沙主场活动启动