语音语料库,也称为口语语料库,是以音频或文本格式保存的讲话的集合。这些集合在开发语音软件和进行语言研究时很有用。语音语料库有两种:自发语音和阅读语音。
转录者将口语转换为书面形式。定义"言语"和"语料库"是什么意思。言语包括思想和事实的集合,通常是以口语形式出现的。人们也可以将任何口语话语看作是言语。语料库又指各种信息的正式集合。
语音语料库,也称为口语语料库,是以音频或文本格式保存的演讲集。用户通常通过录音或基于文本的转录来创建语音语料库。录音可以通过声音存储技术制作,并通常以MP3文件的形式存储在电子数据库中,以创建语料库。另一方面,抄写员,将口语转换成书面形式,然后与其他抄本一起编译。在语音语料库中可以找到任何类型的语音,但这些数据库通常分为两类:第一类是自发演讲,包含了一个人可能发表的非形式化演讲,例如在对话或口头故事中发现的。然而,阅读演讲有一个更正式和预先计划好的结构。例如政治演讲、新闻广播和有声读物阅读。有些种类可能取决于特定的语境,比如采访。言语语料库工具的一个主要优势是它们在帮助创建基于语音的软件方面的实用性例如,许多计算机和其他电子设备将语音识别功能作为一种选择,例如读回键入的文本,将口语单词转换为文本,或者通过独特的声音特征来识别说话人。从语音语料库中提取出来的数据可以帮助增强这项技术,方法是对每一个声音应用基于数学的统计数据集,称为声学模型。此外,数据库还可以帮助开发语言学习录音带。这些功能与其他功能相结合语音语料库的应用。也就是说,学者们可以利用这些保存下来的音频或书面文件,研究构成语言的细微语法变化,因此,语音语料库可以作为学习语音、语序、语序等方面的有价值的工具,和其他语言模型。研究人员可以进一步比较不同地区方言和语言的异同,如果他们创建一个多语言的集合,或者多语言语料库。对涉及语音的语料库的评估是一个被称为语料库语言学的专门研究集中领域,它的计算机实现被称为计算语言学。许多抄本数据库包括符号或标记,这些符号或标记包含有关文本中各个组成部分的信息。这个过程称为注释。在抽象过程中,语言学家将记录和翻译演讲中的各种术语。如果个人希望通过文本了解未知文明,这种输入可能会很有用。语料库研究的最后一步是分析,或者从一组语音成分中得出比较和理论理想。


来源:百闻(微信/QQ号:9397569),转载请保留出处和链接!
本文链接:https://www.ibaiwen.com/web/62369.html
猜你喜欢
-
什么是带薪实习(Paid Internship)?
-
什么是骨盆腰带痛(Pelvic Girdle Pain)?
-
什么是可疑活动报告(Suspicious Activity Report)?
-
我如何成为一名色彩师(Become a Colorist)?
-
什么是牙髓炎(Pulpitis)?
-
如何选择最好的地下室防水系统(Choose the Best Basement Waterproofing Systems)?
-
什么是政府支出(Government Expenditure)?
-
什么是风琴手(Organist)?
-
肌电图机器是如何工作的(EMG Machine Work)?
-
去除血迹的最佳方法是什么(Best Tips for Blood Stain Removal)?
- 热门文章
-
WB蒙特利尔(WB Montreal)——欧美十大最差视频游戏开发商
迅猛龙(Velociraptor)——欧美史前十大死亡动物
什么是果酱猫(What Marmalade Cats)?
神奇蜘蛛侠2(The Amazing Spider-Man 2)——欧美最佳蜘蛛侠电影
faceu激萌怎么把瘦脸开到最大
希瑟(Heather)——欧美十大最佳柯南灰歌
二人梭哈
奥兹奥斯本(Ozzy Osbourne)——欧美十大高估歌手
什么是小脑前下动脉(Anterior Inferior Cerebellar Artery)?
我应该知道康涅狄格州的什么(What Should I Know About Connecticut)?
- 热评文章
- 最新评论
-
- 最近访客
-
- 站点信息
-
- 文章总数:261580
- 页面总数:9
- 分类总数:1
- 标签总数:0
- 评论总数:0
- 浏览总数:74382