中国首家车文化车科技数据中心---“车文化语料库研究中心”
中国首家车文化车科技数据中心---“车文化语料库研究中心”
落地吉利学院外国语言与文化学院
吉利学院外国语言与文化学院车文化语料库研究中心是在学校领导和集团大力支持并在上海外国语大学语料库研究中心技术指导下,于2023年规划,2024年启动建设的中国首个专注于车文化与车科技的语料库研究中心。中心依托外国语言与文化学院孔令翠院长带领的“中国车文化语料库翻译与数字化传播”研究团队,下设八大子语料库研究团队,由精通多国外语且熟悉汽车相关知识与语料库的专业人才构成。
1.国内知名专家高度肯定车文化语料库建设
车文化语料库研究中心筹备与建设过程中,研究团队先后召开三次专家评审会,邀请国内知名专家学者评审和指导车文化语料库建设,同时还邀请汽车学院、吉利领克企业等汽车行业专家参与评审和指导。该项目得到国内相当一批外语教育、语料库语言学与翻译学界知名专家和学者如中国外文局副局长、中国翻译协会副会长黄友义、上海外国语大学胡开宝校长助理、四川外国语大学董洪川校长、四川外国语大学王寅教授、上海外国语大学胡佳圣教授、上海大学傅敬民教授、上海交通大学杨枫教授;大连外国语大学杜耀臣等专家的高度认可和充分肯定,并分别提出宝贵建设意见,极大地鼓舞了我院老师们的士气和决心。
车文化语料库研究中心场馆是在2024年4月中旬开始筹建,5月初获批,5月15建成,时间紧,工期短、工作量大,项目艰巨。中间几度波折,感谢校领导和各职能部门大力支持和多方全力配合,在外国语言与文化学院58位老师的大量心血和汗水浇灌下,我们终于圆满建成近300平米的车文化展馆和教学示范区。
语料库研究中心核心成员合影
本中心收集、整理与建立了古今中外的车历史、文化与技术等八个分语料库,其中的四个语料库为吉利汽车历史、文化、技术与未来科技的专有语料库。
本中心建以致研致用,将语料融入数字化汽车外语专业人才培养、“汽车%2B英语”翻译硕士学科建设、车文化翻译与传播学术研究、跨学科数智化人才培养、以及以吉利品牌为核心的中国国际化汽车人才培育中,旨在推动吉利学院的产教研一体化与高质量发展,助力吉利集团的全球化战略发展与国际化人才培养。
2.车历史、文化与技术八大子语料库
车文化、车科技八大子语料库
01. 中国5000余年车文化历史语料库
在中国古代,车辆不仅是交通工具,更是社会、文化、政治等多个方面的象征和载体。我们团队老师收集了古代的车辆制造、使用和发展,研究了车辆在文学、艺术、宗教等方面的体现,以期该语料库能够为车辆生产制造、车辆品牌赋能、相关行业研究者、教育工作者以及文化爱好者提供丰富的资料和参考,为人们提供全面了解中国车文化历史的资源。
包含古代中国各交通工具种类术语名称,如古代马车、牛车、船车等;古代交通工具的结构和生产技术术语,例如各类车辆组成部分,车辆内外饰等。 记录了中国古代车辆制造技术的发展历程,包括工艺、材料、动力等方面的创新与突破。例如轮辐技术的应用,动力来源的改变和车辆制造工艺的迭代等。收集了中国古代象形文字、图腾纹路、宗教代表符号都有着深邃的内涵,为车辆制造业的外观内饰设计提供灵感来源,为品牌产品文化建设和市场营销赋能,为传承中国文化讲好中国故事提供丰富的语料来源。
02. 世界汽车史语料库
世界汽车史多模态语料库聚焦全球汽车工业的演变与革新,涵盖了从蒸汽机驱动的初期探索到内燃机汽车的崛起,再到当代电动汽车和自动驾驶技术的蓬勃发展,不仅展现了汽车工业从萌芽到成熟的壮阔历程,还记录了各国汽车工业特色、技术革新、市场竞争以及文化影响,为国际汽车行业的交流合作、政策研究、国际人才培养以及汽车文化的传播提供丰富的多模态语料与教育资源。
世界汽车史主要分为两条主线,一以时间轴,二以国别为线,两条主线齐头并进,更加丰富、完整地展现了世界汽车的发展历程。
时间轴依托世界汽车的四次大变革。第一次变革,1886年到20世纪初,流水线大批量生产。该部分内容由李瑞璋老师搜集资料、翻译英文并找寻相关图片。第二次变革,即汽车产品多样化(20世纪初到二战)由苏子娟老师负责搜集资料、双语翻译,补充图源。第三次变革:精益的生产方式(二战之后到 90 年代)主要由黄列梅老师负责翻译、补充信息、搜集图片。第四次变革,即新能源变革时代(上世纪 90 年代至今)由刘媛媛老师负责。
国别线由李芯蕊老师负责,主要从德、法、英、美、日等主要国家的汽车发展阶段入手,并匹配相应的代表性车型。
最后,为了更进一步凸显世界汽车史的显著发展,由乔丽丽老师负责完成了百年世界汽车大事年表,将重要节点、重要事迹及相应图片资源进行整理,并译出英文语料。英文以外的语言,则与彭地老师负责的“多语种语料库”小组合作,最终呈现出多语种的世界汽车百年大事记表。
03. 中国近现代汽车史语料库
团队聚焦中国近现代汽车工业的创立与发展,涵盖中国汽车工业启航阶段、中国汽车工业格局形成阶段及当代新能源汽车产业高速发展阶段,展现了中国汽车工业从无到有,从弱到强的波澜壮阔的历史,为校企人才培养、科研成果传播、企业政策制定、汽车文化科普提供详实的汉英双语多模态数据资料。
第一部分中国汽车工业启航阶段由卢开砚、马晶老师负责,第二部分中国汽车工业格局形成阶段由何曼、敬秋华老师负责,第三部分当代新能源汽车产业高速发展阶段由周悦、代霜负责。三组老师精诚合作,研读资料,确定了中国汽车近现代史多模态语料库的建设思路及建设重点。
今后团队将广纳优秀人才,根据语料库的构建思路,认真研读文献,完成数据的收集、清洗标注、集成对齐、存储管理、分析应用,建成中国汽车近现代史语料库并完成近代史的英译及短视频传播工作。
04. 吉利汽车发展史语料库
创建吉利汽车发展史语料库是为了系统地收集、整理和保存关于吉利汽车这家中国重要汽车制造商的历史和发展方面的信息。该语料库主要记录了在李书福董事长带领下吉利从1997年进入汽车行业开始至今的发展历程,大致将吉利汽车发展史划分成了探索期、1.0时代、2.0时代、3.0时代和4.0时代。
该语料库参与建设过程主要为以下六点:1.明确建库目的与规模;2.收集和整理资料;3.输入和标注数据;4.构建语料库和设计检索系统;5.测试与优化;6.发布与维护。
吉利汽车发展史语料库不仅记录了企业自身的发展历程,也反映了中国汽车工业从封闭走向开放、从模仿走向创新、从国内走向国际的广阔历史背景。通过研究开发这个语料库,我们可以深入了解到吉利汽车是如何在激烈的市场竞争中一步步成长壮大,最终成为中国领先的汽车制造商,成为中国汽车工业发展的一张亮丽名片。
05. 通用汽车术语库
汽车通用术语语料库是一个收集了丰富的关于汽车领域的通用术语和词汇的数据库,涵盖了汽车设计、制造、维修、技术和创新等多个方面的知识。该语料库的构建目的是为在校汽车专业学生、汽车行业从业人员、爱好者和学习者提供一个全面而易于访问的术语参考工具,帮助使用者扩展和巩固汽车领域的专业知识。
汽车通用术语语料库的核心内容:1. 汽车设计和工程术语:涵盖了关于汽车车身、底盘、发动机、传动系统、悬挂系统等方面的术语。2. 汽车制造和装配术语:包含了汽车制造流程中涉及的术语,如焊接、涂装、组装、质检等。3. 汽车维修和保养术语:涵盖了与汽车维护、保养和修理相关的术语,如机油、刹车片、滤清器、轮胎磨损等。4. 汽车技术和创新术语:涵盖了汽车技术和创新领域的术语,如自动驾驶、电动车、智能交通等。
语料库构建思路:
第一,确定汽车通用术语语料库的范围:目前拟在子语料库中呈现以下四个方面的术语的内容:汽车设计和工程术语、汽车制造和装配术语、汽车维修和保养术语以及汽车技术和创新术语。
第二,在确立子语料库范围后,开始收集和整理现有资源:搜索相关的汽车术语和定义,并收集和整理已有的技术文档、汽车手册、专业书籍、在线音视频等资源,包括汽车制造商的文档、行业标准、术语表等,为构建语料库打下基础。
第三,构建术语列表:整理已收集的资源,提取出重要的语料并对语料进行清洗,清洗后使用对齐工具对齐语料,构建出清晰的术语列表。
第四,验证和修订术语:构建出术语列表后,请汽车专业人士或者领域相关的人员验证和修订术语,修改错误、重复或不准确的术语。
第五,维护和更新:汽车行业不断发展和更新,因此语料库的内容也应随之维护和更新。跟踪最新的技术进展、行业标准和术语使用的变化,定期更新语料库,以保持其有效性和实用性。
06. 吉利汽车专用术语库
吉利汽车专用术语语料库的成果展示制作过程主要包括以下几个阶段:策划与准备、视频制作、学生作品收集与展示、语料库分类及教学用途分析。
首先,策划与准备。在成果展示的策划与准备阶段,团队首先明确了展示的主题和目标,决定通过视频选段及脚本、学生作品展示以及语料库分类和教学用途分析来全面展示语料库的成果。团队进行了头脑风暴,制定了详细的展示方案和时间表。由张伟负责整体协调,确保各环节有序进行。其次,视频制作。在视频制作阶段,团队精心挑选了语料库中具有代表性的术语和使用场景。撰写视频脚本,确保内容通俗易懂且富有教育意义。然后,学生作品收集与展示。为了展示语料库在教学中的实际效果,团队收集了学生利用语料库进行的作品。这些作品涵盖了多种形式,包括论文、语料翻译和多媒体展示。团队对学生作品进行了筛选和整理,挑选出最具代表性的部分进行展示。最后,语料库分类及教学用途分析。按照汽车设计、生产、营销等不同领域进行归类,便于用户查找和使用。撰写教学用途分析报告,详细说明语料库在不同教学场景中的应用方法和效果。这些分析结果不仅为教师提供了教学参考,还为企业培训提供了有力支持。
07. 吉利汽车文化语料库
吉利汽车文化语料库收录与吉利汽车文化相关的词汇与语句,涵盖吉利企业文化、吉利品牌文化、吉利赛车文化等多个板块内容,旨在帮助全球吉利员工、合作方、以及用户更好地理解吉利集体的发展理念与品牌精神,让吉利汽车文化获得全球认可与赞赏。整个吉利汽车文化语料库由方圆、方艺静、葛婷婷、章熙苑、谭薇、李佳桔老师共同搭建完成,其中方圆、方艺静、章熙苑老师负责语料库文字和图片资料的查找收集整理,葛婷婷、谭薇、李佳桔老师负责音视频资料和对应字幕脚本的查找收集整理。在搭建过程中,各位老师利用课余时间对语料库资源数据进行数次校对,包括语言质量,标点符号,排版等。在抽检核验过程中,各位老师也是积极参与,认真准备。
08. 吉利汽车科技话语语料库
团队共有组员六人,主要负责吉利汽车相关的技术文本、科技语言、汽车文化、未来蓝图等语料的搜集整理与双语翻译工作。在语料制作过程中,组内多次召开线上线下讨论会,从吉利汽车的产业定位、产品文化、科技内涵与未来企划出发,多方搜集信息文本并加工整理,目前已汇总资料40余页,完成翻译量8000余字,为天地一体化时空信息获取与应用研究中心、甲醇燃料电池研究中心、高性能电池场景应用创新中心、脑科学与智能汽车人因工程研究中心、车文化多模态语料库研究中心的建设奠定了坚实的文本基础。
3.筹建车文化多语种语料库团队
除八大子语料库外,车文化语料库研究中心还有一个特别团队:多语种语料库组,它是一支多语言团队,致力于将车文化和术语翻译成各类小语种,其中包括日语、德语、法语和西班牙语。团队由五位成员构成,都有着丰富的海外留学经验,分别擅长于不同的语言领域,为研究中心的多语种多模态构想贡献力量。
我们的主要工作是对语料库中心各子库内容进行多语种翻译,并校对学生成果中的多语言内容。此外,我们还负责车模型的多语种展示,确保各语种用户都能够深入了解汽车文化的丰富内涵。
今后,我们将协调团队工作,确保翻译质量和效率,并与其他组协调合作,共同推动语料库研究中心的多语种多模态发展。通过我们的努力,希望能够让更多人了解和参与到车文化的跨文化交流中来。
4.启动语音语料库AI应用联合实验室建设
车文化语料库研究中心下一步将建设语音语料库AI应用联合实验室,专注于吉利学院外院特色专业及汽车领域语音技术研究、AI应用项目的,科技合作类创新实验室。语音语料库作为AI人工智能应用的基石,并将其与外语教学、汽车专业相关教学和研究相结合。实验室旨在通过AI软硬件应用的落地,为汽车、专业英语提供最优的教学和研究解决方案。
5.研究中心未来规划
第一阶段 建成中国首家车文化语料库
①建成 8大板块千万级语料库:囊括古今中外“车文化与车科技”全语料;
②呈现多模态形式:文献档案、图像视频、语音对话等;
③建设中英双语语料库;
④标注专业语料;
⑤清洗专业数据;
⑥构建知识图谱。
第二阶段 完成车文化多模态多语种语料库教科研一体化
①与上海外国语大学语料库研究中心合作,加入中国高校语料库联盟;
②扩展多语种语料库:日、德、法、西、俄等;
③汽车语料大数据推动学校学科发展与申硕建设;
④编著一整套8卷世界车文化语料库丛书;
⑤翻译车文化外文典籍10卷;
⑥每年推出1-2期《中国车文化研究》辑刊;
⑦建成四川省青少年科普基地;
⑧孵化与吉利集团的“真题真做”横向科研项目;
⑨打造中国高校车文化教科研第一平台。
第三阶段 推动车文化语料库研究中心商业化、产业化
①重点建设吉利专属汽车发展、科技、文化与品牌四大语料库;
②申请多项吉利汽车语料技术专利;
③为吉利集团提供“教、学、研、产、销、服”全行业语料数据支持与服务;
④推动车文化语料库知识产权商业化运营,向全国乃至全球汽车行业提供有偿语料服务;
⑤将车文化语料库软硬件技术推广到人工智能、智能驾驶等前沿领域;
⑥打造成集学术与商用一体的全国知名语料库;
⑦建设成彰显吉利集团软实力的标志性全球IP。
车文化语料库研究中心将利用汽车相关的语音语料库资源,支持汽车及汽车文化多语言语音语料库、汽车文化多模态语料库、语音识别、语音合成、语音情感分析等技术的研究和开发。这将为外语专业带来新的转型升级机遇和挑战。通过落地AI软硬件应用,研究中心将为汽车专业带来新的发展机遇,提升专业教学水平和科研实力,推动汽车领域的创新和进步,使教学科研、高新技术应用与汽车相关人才尤其是数字化汽车外语人才培养共同促进、合作发展,将车文化语料库研究中心打造成全国全国知名语料库,从而成为彰显吉利集团软实力的标志性全球IP。
- 上一篇:“中国车文化语料库翻译与数字化传播研究团队” 开题评审会隆重举行
- 下一篇:没有下一篇了