原帖由 他喵的 于 2018-5-16 18:29 发表
顺便看看知乎上贴出来的一个92年的视频https://www.zhihu.com/video/979875191366746112
原帖由 @antant 于 2018-5-16 21:45 发表
那个视频内的演示主要是体现语音识别能力而已,和人工智能没关系。必须是固定的操作命令,严格读出,不能有差错,等于人要背命令表。发音规范清晰,命令不出错,接下来就看机器识别声音波形的能力了。。。。
原帖由 他喵的 于 2018-5-16 18:29 发表
顺便看看知乎上贴出来的一个92年的视频https://www.zhihu.com/video/979875191366746112
原帖由 antant 于 2018-5-17 01:00 发表
tnt有陌生输入,需要语义穷举,指点的作用就是缩小穷举范围。比如它的改字号,老罗不需要严格读出语音命令,比如机器首先听写他说出的“改为5号字”,首先把这段音频波形转换为信息,这也是个对比穷举的过程,最 ...
原帖由 @couger 于 2018-5-17 01:27 发表
之所以会觉得92年的视频牛逼,难道不是因为语音输入价值不大,所以大家前些年都没太研究的原因吗?
原帖由 antant 于 2018-5-17 01:00 发表
tnt有陌生输入,需要语义穷举,指点的作用就是缩小穷举范围。比如它的改字号,老罗不需要严格读出语音命令,比如机器首先听写他说出的“改为5号字”,首先把这段音频波形转换为信息,这也是个对比穷举的过程,最 ...
原帖由 antant 于 2018-5-17 01:00 发表
tnt有陌生输入,需要语义穷举,指点的作用就是缩小穷举范围。比如它的改字号,老罗不需要严格读出语音命令,比如机器首先听写他说出的“改为5号字”,首先把这段音频波形转换为信息,这也是个对比穷举的过程,最 ...
原帖由 fatehe 于 2018-5-17 16:19 发表
所以,我并没有要求给机器给我拍“客户最满意的版”,而是降低要求“我经常用的排版”,这是可以自己预设好的排版。
当然不排除未来,机器会提供云计算上最热门的排版给你选择,你只要说选那个就行了。
欢迎光临 TGFC Lifestyle (http://club.tgfcer.com/) | Powered by Discuz! 6.0.0 |