Challenges and Open Problems in Signal Processing: Panel Discussion Summary from ICASSP 2017

目标:通过这一文章找到potential research direction

这篇文章是icassp顶级会议邀请的几位著名人物所写对不同领域的预测。

第一部分 机器学习方向

第一,目前的流行趋势是在深度学习,其特点是采用大数据和大的计算能力获得的,但是其可解释性比较差,而且对于个体的稳定性比较差。现有的研究方法是将深度学习和符号系统结合在一起。

第二,有监督学习已经获得了较好的结果。目前在增强学习和无监督学习还有较多的提升能力。对于无监督学习,可以采用的一种思路是用gan网络来获得更多的样本,同时cross domain的弱监督也是非常有研究价值的。

第三,元学习的思路。

第二部分 图信号方向 Open problems in graph signal processing 

第一,传统的方法采用的是格子结构,而目前的很多数据是非结构化的数据。不仅可以信号本身,还可以描述不同信号之间的联系。例如目前常说的知识图谱就是其中的方向之一。

第二,现在的研究热点是将传统的信号处理方法拓展到现在的图结构中。 

第三部分 语音语言处理  Open problems in speech and language processing 

 第一,这里包含的方向有speech recognition(speech"words), natural language understanding (words"meaning), natural language generation (meaning"words),speech synthesis (words"speech), and machine translation (words in L1"words in L2)。主要用到的思路也是这样的。

扫描二维码关注公众号,回复: 614597 查看本文章

第二,当背景噪音比较大,或者有多个人在同时说话时,目前的性能还是远差于人类的结果。

第三,目前比较流行的趋势是Two emerging trends aimed at addressing some of the challenges are continuous representations and end­ to­ end
training。前者是指将原来的信号转换到了新的连续空间,将原来不定长度变成了定长的信号,从而可以采用传统的机器学习方法。后者的概念可以参考http://www.360doc.com/content/16/1229/22/32626470_618762237.shtml。主要的意思是指不需要进行vad、去噪以及特征提取等过程,而是从输入端的语音,中间包括有神经网络,终端就是文本的输出,这样避免了传输中带来的不便。

 

猜你喜欢

转载自www.cnblogs.com/kyraAct/p/9029089.html