创新文化

【“一所一人一事”展播】马博:应西北边疆之需,铸内容理解之剑

发布时间:2022-10-11

理解,是沟通与交流的前提和基础。多语言内容理解,是通过人工智能技术,让计算机学会处理经由多种语言表达的文字、语音、图像等内容,从而加速各类信息的分析处理,加强各国家、各民族之间的沟通交流,加固我国向西“一带一路”发展的桥梁。

一、脚踏实地:立足区域需求,追求特色创新

新疆,中国西北边陲,占据我国国土面积的六分之一,56个民族的人们长期生活的家园。新疆,也是我国“一带一路”倡议的向西出口和枢纽,与8国接壤,具有独特的经济、文化和战略地位。

一直以来,自然语言处理被称作人工智能皇冠上的明珠,是因为语言是人类区别于动物的显著特征,同时也体现了该项技术的难度。相较于汉语、英语等资源丰富的大语种语言,维吾尔语、哈萨克语以及新疆周边“一带一路”国家的很多语言都属于资源相对缺乏的小语种,其分析处理水平和能力长期落后于主流语言,受到的关注度也相对较低。马博副研究员来自中科院新疆理化所多语种信息技术研究室团队,从2008年至今长期立足新疆本地的区域需求,开展多语言资源库、知识库建设、多语言语义分析与信息抽取、海量数据建模与分析等方面的研究工作,积累了较丰富的科研和系统研发经验。

“计算机科学与人工智能技术具有很强的通用性,但如何立足区域需求,追求特色创新,并通过信息技术助力边疆建设?一直是我们团队共同努力在解的一道题”,马博说。

二、跨界抉择:从零开始,亦是从心出发

马博的博士研究方向是语义网与语义检索,在2010年左右,还没有太多的人了解什么是Web3.0,创建万维网和提出语义网的蒂姆·伯纳斯·李博士也还没有获得图灵奖,而何为计算机所能理解的“语义”,更是至今仍在热烈讨论的一个学术概念。

入所工作时,结合实际需求,他的研究方向确定为大数据分析处理,并一干就是6年,在同事们的共同努力下,所做的工作成功应用在了教育、民生、安防等多个领域,但马博始终关注着自然语义处理技术的前沿进展。2019年,大数据与人工智能技术均在飞速蓬勃发展,各种算法、模型和平台层出不穷。“在我眼中,一片人工智能应用与创新的蓝海正在展开,而面向新疆地区的多语言智能信息处理还仍处于起步阶段”,马博说。在深思熟虑并报请研究室同意后,马博将他的研究领域调整为开展面向新疆特色需求的多语言智能技术研究。这一年,他35岁,也完成了个人职业生涯上的一个重大转变。

确定了这个大方向后,很快,团队将具体的研究方向定位在“多语言内容理解”,那么接下来,就是撸起袖子加油干了!


马博与同事们

三、聚力凝核:深耕向西“一带一路”内容理解

内容理解研究不易开展,面向低资源小语种的模型训练由于受限于数据规模,也给工作提出了挑战。“得益于多语言资源库建设和多语言机器翻译研究的前期积累,我们可以站在快车道上直接出发”。团队的强项是应用型基础研究,但想在一个领域做深、做强,必须首先要有自己的拳头技术,才能在后期拿得出拳头产品。“人总是下意识地更愿意去做自己最擅长的事,而不一定是最正确的事;但在科研领域,这种思维和行动上的惯性犹如温水煮青蛙,千万要不得”,马博说。因此,从研究方向确定之初,团队便明确了几件事情:

首先,达成了一项共识:“我们目前有弱点,它就在那,我们正视它,我们讨论它,我们克服它,我们要把这些弱点逐渐变成优势”。

其次,明确了“业绩不向辛苦低头,价值观不向业绩低头”,核心成员各负责一部分主攻内容,并要用各自的成绩说话。在科研领域,“没有功劳也有苦劳”是产生不了创新性成果的。

第三,“有常,无畏”,信息技术更新迭代快,干这行的,很难做到靠经验吃老本儿, 因此,首先要保持持续学习的能力,做到“有常”;做人做事要知进退,有所畏,但在科研工作中,遇到问题要迎难而上,做到“无畏”。

“最善泳者,忘水”。

成立“多语言内容理解”关键技术攻关先锋组

四、疆才疆用:请留下一同建设家乡与边疆

马博出生在一座东北老工业城市,被誉为钢铁行业共和国长子的 “钢都”:辽宁省鞍山市。50年代的鞍山钢铁公司,钢铁产量一度占据了全国的半壁江山,但至今仍处于转型期中。东北与新疆在这点上有类似之处,出于种种原因,一方面自己的孩子出去上学后很少选择回到家乡工作,另一方面又很难引进急需的外部人才。人才流动背后体现着城市之间综合实力的博弈,大城市优势明显,其他地方很难吸引到年轻人的关注。

“但我也常在思考,我们一生到底追求的是什么?小镇做题家的理想工作难道就是大厂程序员?苦读二十年只是为了在大大的城市里有个属于自己的小小的房子?还要为了这个小小的窝背上大大的壳?”如果按照上述方式来提问,可能大家都会陷入思考一时难以作答。中国很大,世界更大,我们应该多走走、多看看、多想想,找到真正适合于每个人自己的路。

“一座城市、一个地方的发展,不应只看眼前的综合实力,也该把目光放长远,去评估一下她的发展潜力。同理,作为以科研工作为事业的我们,不该只关注眼前大城市的喧嚣与繁华,更要关注这座城市的内秀和未来”,马博说。目前,他们组建了一支年轻化、专业化的本地信息技术科研团队,成员毕业于中国科学院大学、清华大学、复旦大学、华中科技大学、武汉大学、吉林大学、新疆大学等全国多所高校,很多都是在外求学后,选择回来建设自己家乡的年轻人。

在这里,不需为自己的小窝发愁;在这里,有“一带一路”的发展前景和施展抱负的舞台;在这里,还有其他人眼中的诗和远方。因此,同学们,同志们,朋友们,请来这里看看,欢迎留下一同建设我们的家乡与边疆。