多多读书

手机浏览器扫描二维码访问

第8部分(第1页)

缩和语音搜索匹配算法一直是克里优化的俩个重点。

克里一直在不停地模拟改进提取语音语义特征值的算法,通过不断压缩冗余值,在保持不失真的情况下持续不断缩小语音样本语料库大小,另外一方面也不断改进对语音语料库智能搜索匹配算法。

优化算法杜克帮不了什么忙,但是收集尽可能多的语音样本杜克却没有问题,所以杜克的每一天都过着一种非常充实的生活,日复一日地搜索下载不同类型的语音样本供克里分析提炼,同时不断去学习理解克里所创造的这些全新的处理算法,要敲开麻省理工的大门。

杜克必须要有一篇体现自己能力的世界领先水准的语音识别基础理论创新性论文,可是在克里的知识库中并没有现成的语音识别知识,这些对于克里来说太老旧了,老旧到比莱姆都没有为克里增加这些知识。

而克里现在做的就是在地球上现有语音识别理论和算法基础上,利用他强悍到无边的模拟能力,不断地模拟各种不同的语音处理算法。

通过模拟来找到一种更加有效的——这种方法虽然有些笨拙,但是有了克里超强的运算能力,毕竟每秒钟成千上万种可能算法都可以模拟,使得这种笨拙的方法也有相当的效果,找出了好几种可能的优化算法,将识别率和反应时间提升到了一个新的高度。

可是要将这些成果用地球人能够理解的语言和理论写出来,还要让人能够看懂,不管是对克里还是杜克来说都是一个新挑战,因为克里不是以01为核心的机械二进制思维模式,而是生物多态思维模式。

尽管克里现在已经能够瞬间同时模拟出地球上常见十多种不同性能PC机虚拟机——为了让克里能够准确了解地球上电脑的运算能力,杜克买了四台不同接口的主机和接近二十块市面主流PC机CPU提供给克里分析和测试性能基准,然后克里根据这些配置的性能来进行虚拟对应的模拟器。

可是这些特殊的虚拟机由于不需要让人理解,所以克里完全可以按照自己的运算方式来创造,因此性能虽然相当,但是实现模式却大相径庭,比起地球上RISC和CISC俩种不同架构的CPU来说,复杂程度都不是一个数量级的。

因此在克里完成了按照他自己模式实现的算法后,还要按照地球上01规则来重新实现,这个对于克里来说确实是一种巨大的挑战了,更别说论文还要在此基础上再次抽象,不光要有软件实现算法,还要建立起以地球数学基础能够证明的数学模型。

因此克里几乎二十四小时不间断地不断运转着,最终模拟算法能够在最低基准上面实现1秒内达到97%识别率,而在双核2G主频电脑上实现1秒内99%以上识别率之后,足足又用了俩个周的时间。

在杜克看完十几本数学专著,下载研究了好几个开源语音识别软件的基础上,克里才完成了语音识别新算法的论文和协助杜克开发完成一个在地球电脑上运行的语音识别软件。而这个语音识别软件的第一个应用就是包装成为一种语音输入法。

海角论坛。完成语音识别软件和论文写作俩个任务,杜克现在是一身的轻松。

他注册换了一个马甲加入到一个对克里的战争剧情发展讨论贴中,为了测试新软件,只见他对着电脑麦,尽量模仿各种不同的腔调口音说着话,这些话很快就被电脑识别变成文字去回复论坛中各种文青对人物和剧情的分析。

杜克对剧情了若指掌,分析起来当然头头是道,往往是一大段一大段的精辟分析,很快就引起了粉丝们的关注,当然有了语音识别输入,杜克的虽然回复内容实在,可是每次回复却还是比论坛中任何人都要快速。

感觉就算比起专业速记人员也毫不逊色。

“嘿,哥们你用的是神马输入法,怎么回复那么快,几乎是秒回了?”一个文青终于忍受不了杜克这种飞一般的回复速度的好奇,忍不住发问了。

什么输入法?杜克一愣,随即反应过来,自己为了测试刚刚开发出来的语音识别输入法,一时间没有注意控制速度,没想到如此拉风的秒回竟然不知不觉就引发了关注。

“一种新型的语音输入法。”杜克变幻着用一种类似老赵的铁岭声音说道,立刻电脑屏幕上准确将他的语音转换成文字,收录到的老赵语音样本不少,识别率自然完全没有问题。

在刚才的讨论中,杜克已经用他能够想出来的所有发音方式进行了模拟测试,识别准确率百分之百,虽然他现在只是将电视机声音调小作为背景噪音,离一个复杂噪音环境还有一些距离,但是由于杜克变幻着不同口音和语气,能够达到这种水平,几乎可以看到,键盘输入法的时代结束了,这款语音输入法的推出将宣告一个新输入时代的开始。

“嗨,哥们,你逗我玩儿吧,企鹅语音输入法我用过,那有你这速度和准确率。”那个文青不相信的回复道。

“呵呵,刚拿到的内部测试版本,哦,Sala输入法,不出意外的话很快你就能够从各大网站下载到预览版了。”杜克想起苹果的Siri,不禁随意地杜撰了一个类似软件名字回复道。

“真的还是假的?哪家公司研发出来这么牛的输入法?”

“这是公司才开发出来的最新作品。正在测试中,呵呵,不过真的好用。摆脱键盘的感觉还真是不错啊”

“收费还是免费的?免费的话能不能将你的测试版本传一个给我,我的邮箱是”

“大哥,跪求发一个到”

很快贴子讨论就偏离了方向,开始有越来越多的人关注到这俩个人的对话,到最后都加入到求Sala输入法的行业,一时间满屏都充斥着求Sala语音输入法的回复。

再度创造一个轰动效应的杜克,完全没有想到一个软件实测居然会如此演变,由此可见这个语音输入软件的适用范围实在太广泛了。但是杜克这次没有头脑发热就答应下来,他就算再缺乏情商,也知道这个时候把软件免费发出去是绝对不合适的,可见随着智商的激增,尤其是经历了同俩位编辑的谈判后,杜克的情商还是有了那么一点点的进展迹象。

实战试用非常成功,验证语音识别新算法没有什么问题,杜克满怀信心地将论文电子稿件投递到了JACM——这可是计算机业界顶级刊物,能在这上面发表论文,可以无可置疑的证明自己强悍的科研能力,比一百个知名教授的推荐都要有效,再配合杜克无可挑剔的GRE成绩,申请麻省理工博士可谓毫无压力。

第十五章 要开公司了

但是怎么赚钱呢?是免费模式,还是注册收费模式?这还真是一个问题。杜克挠了挠头,初步测试如此成功,引起的反响也非常不错。

杜克就算情商再低,也知道自己这个语音识别输入软件恐怕注定是要终结一个时代,一旦推出毫无疑问将是一个非常受欢迎的大众产品,如果注册收费的话,应该能够赚不少钱?

即便是现在软件只支持中英文俩种语言输入,但是这俩种语言确实世界上人数最多,据不完全统计,说英语的人数超过全球人口的三分之一,这可就是二十多亿人啦,而中文人数不用费劲计算毫无悬念超过十四亿,好吧,就算去除中英文兼通的重复计算人数,俩种语言总量算三十亿不过分吧?

三十亿啦,就算电脑普及率只有百分之三十,也有近十亿用户,而注册收费再便宜,一份软件收费十块钱吧,这个价格不到一顿盒饭钱够便宜了吧,保守估计有电脑的用户中有三分之一选择这个软件,这潜在的客户都将以数以亿计,在这样恐怖的客户基础上,那么潜在的收入就是十亿以上?

杜克略微心算了一下,不禁就被这个结果吓了一跳,这个软件的潜在收入未免也太惊人了一点吧?这样算来,是否可以说自己已经是准亿万富翁了?可怜的杜克脑海中闪过亿万富翁这个词,心中不禁抽搐了一下,这是不是太快了点?

热门小说推荐
悦女吴县

悦女吴县

书名?阅女无限??呵呵,广大银民,请看清楚哦。吴县,这个二十岁的青涩小子,进城上学,居然一不留神,取悦于众多美女,在众女的帮助下,事业也是蒸蒸日上。且看主角如何将有限的生命,投入到吴县的悦女事业中去。蹩脚的猪脚,由一个初哥,逐渐成为花丛高手。...

一揽众美在三国

一揽众美在三国

一个现代人,来到了古代,哇噻,美女如云呀,一个一个都要到手,战争阴谋铁血一揽众美,逍遥自来快乐似神仙本书集铁血与情感于一身为三国类中佳品。...

张三丰弟子现代生活录

张三丰弟子现代生活录

张湖畔,张三丰最出色的弟子,百年进入元婴期境界的修真奇才。他是张三丰飞升后张三丰所有仙器,灵药,甚至玄武大帝修炼仙境的唯一继承者,也是武当派最高者。在张三丰飞升后,奉师命下山修行。大学生,酒吧服务员,普通工人不同的身份,不同的生活,总是有丰富多彩的人生,不同的遭遇,动人的感情,总是让人沉醉不已。武林高手...

修真位面商铺

修真位面商铺

成仙难,难于上青冥!修真难,没有法宝没有丹药没有威力巨大的符箓,没有强悍的天赋。但是自从有了位面商铺就不一样了,有了位面商铺一切都有了。什么,修真界最普通的洗髓丹在你那里是绝世神丹!什么,你们那个位面遍地都是各种精金矿物,精铁灰常便宜!前世走私军火的商人,今生在修真界同样要将商人当做自己终生的追求。我只是一个做生意的,修炼真仙大道只是我一个副业。成为位面商铺之主,横扫诸天万界。商铺在手,天下我有!...

天美地艳男人是山

天美地艳男人是山

从农村考入大学的庾明毕业后因为成了老厂长的乘龙快婿,后随老厂长进京,成为中央某部后备干部,并被下派到蓟原市任市长。然而,官运亨通的他因为妻子的奸情发生了婚变,蓟原市急欲接班当权的少壮派势力以为他没有了后台,便扯住其年轻恋爱时与恋人的越轨行为作文章,将其赶下台,多亏老省长爱惜人才,推荐其参加跨国合资公司总裁竞聘,才东山再起然而,仕途一旦顺风,官运一发不可收拾由于庾明联合地方政府开展棚户区改造工程受到了中央领导和老百姓的赞誉。在省代会上,他又被推举到了省长的重要岗位。一介平民跃升为省长...

恶魔法则

恶魔法则

一个一无是处的,被认为是废物和白痴家伙,把灵魂卖给了恶魔,能换取到什么?美色?力量?财富?权力?  颠覆这世界的所有规则吧,让我们遵寻着恶魔的轨迹  ...