语音数字信号处理技术应用 — 创新点头脑风暴

  • A+
所属分类:音频杂谈

最近在总结语音数字信号处理的应用,发现应用真是五花八门,这在我介绍一些,大家可以去补充或一些自己觉得会比较好玩的应用。

1. 音频后处理,如低音特效,环绕,3D效果。 代表技术或公司:DOLBY, DTS(SRS), Qsound, 还有新秀: Sontia.

介绍一下Sontia: www.sontia.com

    自2004年起,Sontia发明,开发,并获得了许多音频技术的专利,其中以音频品质和“有机”处理技术为主。技术开发的二个方向是:

    a) 声学成像系统

    b) 线性和声控制

    Sontia 技术背景是 the Institute of Sound and Vibration Research (ISVR) at the University of Southampton. 所以Sontia 将来技术推广做得不错,那完全达到SRS Labs样的高度。

2. 音频APP 应用

    这方面被王哥(王戈) 做到无人能及的高度了,大家关注一下:Sumle http://www.smule.com/

    玩过Ocarina、Magic Piano、AutoRap等音乐应用的人都会把Smule公司看成是一个总是给人以无限惊喜的移动音乐应用开发商。iPhone可以摇身一变打造成可以弹可以吹可以唱的百变乐器。现在已经得到确认,传奇的音乐应用开发者,Smule创始人——王戈!

    王哥让音频技术工作者见识到,原来音频还可以这样玩。

3.  音频与网络结合应用

    这方面国内有几家企业做得相当不错。介绍几家,排名不分先后:

    a) 广州欢聚时代 --- 语音YY

    不管是从音质还是产品的运营都做得相当成功,直接结果是拥有几亿的注册用户。基于网络应用的产品,用户群大,就意味着赢利和统治力。(腾讯就是例子)

http://www.huanju.cn/index.html  语音YY 有很多很有说明力的数据:例如 注册用户数,同时在线人数,总共通话时间等。据我所知,公司高层很重视音频和视频基础技术的研发投入,将来的发展很值得大家期待。

    b) 杭州天格科技,www.jhtg.cn

    说到天格科技可能有点陌生,但提到其运营的产品却是大家耳熟能详。杭州天格科技旗下主办的9158,是一家提供个人家园、多人视讯、交友即时通讯、网络卡拉OK等娱乐互动服务的专业网站,同时还包括新浪SHOW、新浪微秀、多人虚拟视频等多个基于视频和音频的产品运营和技术研发。由于注重用户体验,真正从满足用户需求的角度去开发和运营,故杭州天格科技的经营能力和业绩创收在国内同类产品中名列前茅。同时,公司高层极其重视与产品相关的基础技术的研发,联合高校进行前沿技术的研发,这方面国内相关企业很少这样做。正是如此,公司已拥有40多项产品证书和技术专利,并获得浙江省经济和信息化委员会颁发的《软件企业认定证书》,被评为国家高新技术企业与浙江省软件企业,“浙江省高新技术企业研究开发中心建设单位”、“2011年度拱墅区优秀文化创意产业基地”、“拱墅区专利试点企业”、“拱墅区重点骨干企业”等的荣誉。研发持续的重点投入,注重用户体验的运营方式,杭州天格科技发展前景不可估量。

     c) 腾讯Qtalk, 微信

腾讯拥有10亿之众的全球注册用户,真是做什么都行。由于QQ用户数字帐号统一,数据后台打通,QQ号成为众多应用软件和电商身份入口,只要他开发相关的应用,用户怕迁入就变得相当简单,这也是国内企业尽量不做与腾讯重叠的业务。

     微信也正是依靠QQ用户群,从0到突破2亿用户,距离推出只用了14个月时间。基于语音应用,腾讯布局是Qtalk注重于PC业务,业务跟YY语音差不多,如:游戏公会,网络K歌等。 微信注重于移动应用,去挤压米聊,艾米,YY手机语音等。

腾讯在众多的用户支持下,更多的是去关注用户体验,但在音频或视频方面的研发投入不是很大。据说(仅仅是据说,如不对就告之,我修改)微信中的语音编解器是采用AMRNB, 不知道有没有考虑到技术专利问题.

      d) IS语音 --- 上海勤和互联网技术软件开发有限公司

      国内最早一家做语音视频聊天软件, 目前也在注重移动平台. IS语音音质一般,但性能较为稳定,在国内也拥有一大批用户。

      e) ET语音 --- 盛大创新院的产品

      对这个项目不想多说了,曾经ET音质在国内算是最好的。即使拥有盛大超过8亿多用户这一先天优势,ET语音项目夭折。我想这主要原因在于盛大些项目组的决策层和运营方式导致的。

      除了上面列出的,其它运营的,不知名的同类软件数不胜数啊,有的已成为过去,有的还在挣扎。如:巨人DuDu, 盛大ET手机版---通通,等等。

      刘品总结:音频与网络结合生命力就很强了,如在运营时注重于技术的创新,而不是仅仅组装外面的开源技术(如语音引擎), 这类产品会具有大量用户和较清晰的赢利模式。最后国内会有一二家像skype或超过skype更注重社区化音视频应用软件。

      关于这方面我想其实应用可以做到线下,例如线上K歌和线下K歌相结合互通,实际运作模式,我曾经真是好好去想过。

4.  语音识别和合成

   苹果(Apple) Siri, 让语音识别技术应用更加明朗化。语音识别技术上世纪八十年代成熟于实验室,然后由于实际应用中噪声问题一直找不到与实际应用的结合点。

   曾经语音识别技术被众多的知名公司视为压箱底的技术,只要能叫得上名字的国际大公司一定有语音识别的研发组,如Microsoft, Google, Moto, 腾讯,百度,Nuance, 盛大创新院,Sharp,中科讯飞等。

   后来一直找到应用点,2008年左右,Moto, Sharp 等公司把语音识别研发组就取消掉了。盛大创新院语音识别组也有名噪一时,最终也因不能很好实用化,导致高层不重视,人员大量流失。

   目前语音识别和合成外面实用化技术,国外看Nuance Communications; 国内就看中科讯飞. 其它号称自己技术多的同类公司,我个人看来都是浮云。

5.  语音技术IC 应用

    这些公司大多了,很多语音或音频Codec IC, 声卡公司。例如:创新(http://cn.creative.com/corporate/about/).在这我就介绍一些新出现的公司

      a) audience http://www.audience.com/

      audience技术就是专注于声音采集的降噪,提升语音音质。audience 曾经很火,因为iphone 用他们的IC,现在iphone 5不用他们的,但他还是有点火,因为除了iphone, 其它smartphone 还是用他的,包括三星,HTC等。

      b) 南京富迪科技 http://www.fortemedia.com/about_us.shtml

      这家公司我很早就关注,因为从语音技术研发来说,中华儿女(特别是华人)还是主力军。例如,DOLBY, SRS, DTS,里面很多核心研发人员都是华人,但把研发主力放在国内这种注重基础技术研发的公司,我最早发现就是南京富迪科技。南京富迪科技在小型麦克阵列方面的应用技术做了大量的工作,也有很多技术已应用到相关设备中。

在这我好奇的是,为了南京富迪科技没有抢占到像Audience 一样的市场。前几年,南京富迪科技出现了大量人员流失情况,我在阿尔卡特--朗信就碰到过从那边出来的人。

      c) WAVES http://www.waves.com/

       WAVES公司的产品一直是插件中的贵族,在国外有很多著名的录音师专门使用WAVES的产品做后期。它几乎囊括了WAVES公司所有的插件产品,支持DX、PROTOOLZ、MAC插件。这是专业音乐工具中内容最多、功能最全的效果器包,内含二十多个效果器,质量非常高,是最受欢迎的软件效果器产品。它由美国Waves公司出品,几乎支持所有的插件平台,包括苹果机的VST、MAS、RTAS、AudioSuite平台和PC机的DirectX和RTAS平台。

WAVES 已经把市场做到笔记本电脑,电视和手机上来了。我现在的笔记本电脑就有WAVES MAXXAUDIO3 LOGOG,

刘品总结:这类公司太多,在这就列出三个。一点感受,一流的技术也要有一流的市场能力。如在这阵营中发展起来,要有特色且真正实用的技术。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: