广告

不同演讲质量和空间化下的谈话者识别(研究III)

章节
  • 23下载
的一部分电信服务中的T-Labs系列本系列(TLABS)

抽象的

本章介绍了关于在声学上更复杂的听力测试场景中的行为谈话者识别的第三个试验研究,涉及两个讲话者之间的“转弯”。根据非空间和空间语音再现模式期间的谈话者位置提示的可用性,参与者基于不同感知和认知过程的响应策略。在低语音传播质量的条件下,由于展示或失控语音线索的屏蔽或失真,更高的感知 - 认知负荷(与主观的谈话者识别工作),通过动员信息处理资源来包括[主观评级的初步分析在主要实验期间收集的数据在Uhrig等人中描述,测试了基于扬声器的空间语音再现的经验(QoE)模型的体验。:2020多媒体经验质量(QOMEX)的第十二届国际会议。IEEE,Athlone,2020,P 1-6。]

关键词

谈话者识别 说话的本地化 语音传输质量 空间化 语音再现 喇叭 谈话者转弯 声源定位 语音识别 反应时间范式 知觉线索 言语感知 空间关注 选择性关注 语音可懂性 说话的鉴定工作 语音相似 连续评定量表 响应时间切换成本 感知 - 认知负荷

参考文献

  1. 1.
    ITU-T建议书P.800,传输质量的主观测定方法(国际电信联盟(ITU),日内瓦,1996)谷歌学术
  2. 2.
    J.Blauert,空间听觉:人类声音定位的心理物理学,Rev。edn。(MIT新闻,剑桥,1997)谷歌学术
  3. 3.
    D. Brungart, M. Ericson, B. Simpson, Design considerations for improving effectiveness of multitalker speech displays, in2002年国际听觉展示会议论文集,日本京都,2002年,第1-7页谷歌学术
  4. 4.
    S.J.运气,事件相关的潜在技术简介,第二版。(MIT Press,Cambridge,2014)谷歌学术
  5. 5.
    S. Uhrig,G.Mitgag,S.Möller,J.-N。voigt-antons,p300表示超出语音变化的语音质量的上下文相关的变化。J.神经仪。16(6), 066008 (2019)谷歌学术
  6. 6。
    S. Uhrig,A. Perkis,D.M.Behne,语音传输质量对皮质听觉引起潜力指示的感觉处理的影响。J.神经仪。17(4), 046021 (2020)谷歌学术
  7. 7。
    r·w·普罗科特,t·范·赞特,简单和复杂系统的人类因素,第3 edn。(CRC Press,Boca Raton,2018)谷歌学术
  8. 8。
    S. Uhrig,S.Möller,下午Behne,U.P.Svensson,A. Perkis,测试基于扬声器的空间语音再现的经验质量(QoE)模型,2020第十二届多媒体体验质量国际会议(QoMEX)(IEEE,Athlone,2020),PP。1-6谷歌学术
  9. 9。
    对话转换过程中听觉空间注意的转换成本。前面。Neurosci。9.,124(2015)CrossRef谷歌学术
  10. 10.
    G. Lin,S. Carlile,在会话转向过程中切换非空间注意的影响。SCI。代表。9.(1),8057(2019)谷歌学术
  11. 11.
    V. Best, J.B. Ahlstrom, C.R. Mason, E. Roverud, T.K. Perrachione, G. Kidd, J.R. Dubno,谈话者识别:掩蔽、听力损失和年龄的影响。j . Acoust。Soc。是。143(2),1085-1092(2018)CrossRef谷歌学术
  12. 12.
    M. Latinus,P.Belin,人类语音感知。Curr。BIOL。21(4),R143-R145(2011)CrossRef谷歌学术
  13. 13.
    B.C.J.摩尔,听力心理学导论,第6 edn。(Brill,Leiden,2013)谷歌学术
  14. 14.
    R. Drullman,A.W.Bronkhorst,多通道语音可懂度和谈话者认可,使用单声道,双耳和三维听觉介绍。j . Acoust。Soc。是。107(4), 2224 - 2235 (2000)CrossRef谷歌学术
  15. 15.
    K. Blum,G.-J.Van Rooyen,H. Engelbrecht,空间音频,以协助电话中的扬声器识别系统、信号与图像处理国际会议2010(里约热内卢,2010年)谷歌学术
  16. 16。
    D.S. Brungart,信息和精力充沛的掩蔽效果在两个同步讲话者的看法中。j . Acoust。Soc。是。109(3), 1101 - 1109 (2001)CrossRef谷歌学术
  17. 17。
    D.S.Brungart,B.D.SIMPSON,M.A. ERICSON,K.R.斯科特,信息和精力充沛的掩蔽效果在多个同步讲话者的看法中。j . Acoust。Soc。是。110(5),2527-2538(2001)CrossRef谷歌学术
  18. 18。
    M.J. Traxler, M.A. Gernsbacher主编,精神语言学手册,第二版。(爱思唯尔,波士顿,2006)谷歌学术
  19. 19。
    F. Köster, F. Schiffner, D. Guse, J. Ahrens, J. Skowronek, S. Möller, Towards a MATLAB toolbox for imposing speech signals impaired, in .音频工程学会公约,第139卷(2015)谷歌学术
  20. 20.
    M. Wältermann, A. Raake, S. Möller,窄带和宽带语音传输的质量维度。Acta Acust。常规。96.(6),1090-1103(2010)CrossRef谷歌学术
  21. 21.
    ITU-T推荐P.56,主动语音级别的客观测量(国际电信联盟(ITU),日内瓦,2011年)谷歌学术
  22. 22.
    关键词:背景噪声,信息内容,语音质量评价,VoIP应用j . Acoust。Soc。是。123(5),3066-3066(2008)CrossRef谷歌学术
  23. 23.
    L.FernándezGallardo,基于通信信道的人与自动说话人识别,爵士。电信服务中的T-Labs系列(Springer,Singapore,2016)188金宝搏beat官网谷歌学术
  24. 24.
    莫勒,质量工程:Qualität kommunikationstechnischer Systeme(188金宝搏beat官网施普林格,海德堡,2010)CrossRef谷歌学术
  25. 25.
    ITU-T建议书851,基于口语对话系统的电话服务主观评估(国际电信联盟,日内瓦,2003年)谷歌学术
  26. 26.
    F.Köster,D.Guse,M.Wältermann,S.Möller,离散ACR规模与延长连续规模的传播演讲的质量评估之间的比较Fortschritte der Akustik - Daga 2015:Plenarvortr。你。Fachbeitr。天。41. DTSCH。jahrestg。F。傲慢。(Dega,Berlin,2015),PP。150-153谷歌学术
  27. 27.
    M.Wältermann,基于维度的传播语音质量建模,爵士。T-Labs系列在电信服务(施普林格,海德堡,2013)188金宝搏beat官网谷歌学术
  28. 28。
    a . RaakeVoIP的语音质量:评估和预测(威利,奇切斯特,2006)CrossRef谷歌学术
  29. 29。
    A. Raake, C. Schlegel, K. Hoeldtke, M. Geier, J. Ahrens,听力和对话质量的空间音频会议,在音频工程学会会议:第40届国际会议:空间音频:感知空间之声(2010)谷歌学术
  30. 30.
    J. Skowronek, A. Raake, studies on the quality of experience for multi-party audio conferencing, in第12届国际演讲协会年会(Interspeech)(ISCA,2011),PP。829-832谷歌学术
  31. 31.
    A. Skowronek,A. rake,认知负荷评估,语音通信质量和空间和非空间音频会议呼叫的经验质量。言语交流。66.,154-175(2015)CrossRef谷歌学术
  32. 32.
    G. KIDD,T.L.Arbogast,C.R. Mason,F.J. Gallun,知道在哪里听的优势。j . Acoust。Soc。是。118(6),3804-3815(2005)CrossRef谷歌学术
  33. 33.
    L. Fernández Gallardo, S. Möller, M. Wagner,通过窄带和宽带通信系统传输的人类说话人识别的比较10. ITG讲话沟通研讨会的程序(2012),PP。1-4谷歌学术
  34. 34.
    L. Fernández Gallardo, S. Möller, M. Wagner,通过不同用户界面和传输通道传输的已知声音的人类说话人识别,在声学、语音与信号处理(IEEE,Vancouver,2013),PP。7775-7779谷歌学术
  35. 35.
    N. Schuck,R. Gaschler,D. Wenke,J. Heinzle,P. Frensch,J.-D。Haynes,C. Reverberi,内侧前额叶Cortex预测内部驱动的策略转变。神经元86.(1),331-340(2015)CrossRef谷歌学术
  36. 36.
    R. Gaschler,N.W.Schuck,C. Reverberi,P.A.Frensch,D. Wenke,偶然的协变者学习导致战略变革。普罗斯一体14(1),E0210597(2019)谷歌学术
  37. 37.
    A.A. Zekveld, M. Rudner, S.E. Kramer, J. Lyzenga, J. Rönnberg,在听力过程中,降低语音相似性比增加目标和掩蔽者语音的空间分离更能减少认知加工负荷。前面。神经科学8.,88(2014)CrossRef谷歌学术
  38. 38.
    T. Koelewijn, H. de Kluiver, B.G. Shinn-Cunningham, A.A. Zekveld, S.E. Kramer,小学生的反应显示当注意力难以集中时,听力努力增加。听到Res。323,81-90(2015)CrossRef谷歌学术
  39. 39.
    E. Donchin,A.F. Kramer,C.D.有趣的,事件相关的大脑潜力对工程心理学问题的应用,心理生理学:系统,流程和应用程序,由M.G.H. Coles, E. Donchin, S.W. Porges,第三版。(吉尔福德出版社,纽约,1986),702-718页谷歌学术
  40. 40。
    J.R. Simon,上午。小,处理听觉信息:从无关紧要的提示干扰。J. Appl。心灵。53(5), 433 - 435 (1969)CrossRef谷歌学术
  41. 41。
    j。r。西蒙,对刺激源的反应。j . Exp Psychol。81.(1),174-176(1969年)CrossRef谷歌学术
  42. 42.
    学术界。4 .卢永平,空间Stroop效应与位置信息对绩效的影响。Psychon。公牛。牧师。2(2),174-207(1995)CrossRef谷歌学术
  43. 43.
    A.S.师,听觉场景分析:感知的声音组织(麻省理工学院出版社,剑桥,1990)CrossRef谷歌学术
  44. 44.
    A. Ihlefeld,B. Shinn-Cunningham,在选择性语音识别任务中,从精力充沛和信息屏蔽的空间释放。j . Acoust。Soc。是。123(6),4369-4379(2008)CrossRef谷歌学术
  45. 45.
    B.G.Shinn-Cunningham,基于对象的听觉和视觉关注。趋势Cogn。SCI。12(5),182-186(2008)CrossRef谷歌学术
  46. 46.
    (1)空间线索对听觉物体选择和形成的影响。j . Acoust。Soc。是。124(4),2224-2235(2008)CrossRef谷歌学术
  47. 47.
    V.最好,E.J.ozmeral,N.Kopčo,B.G.Shinn-Cunningham,物体连续性增强了选择性听觉的关注。Proc。NAT。阿卡。SCI。105(35), 13174 - 13178 (2008)CrossRef谷歌学术
  48. 48.
    V. Best, B.G. Shinn-Cunningham, E.J. Ozmeral, N. Kopčo,探索听觉空间连续性的好处。j . Acoust。Soc。是。127(6),EL258-EL264(2010)CrossRef谷歌学术
  49. 49.
    I. Koch, V. Lawo, J. Fels, M. Vorländer,在鸡尾酒会上切换:探索听觉选择性注意的有意控制。j . Exp Psychol。嗡嗡声。感知。执行。37(4),1140-1147(2011)CrossRef谷歌学术
  50. 50。
    V. Lawo,J. Fels,J. Oberem,I. Koch,故意注意Dichotic听力:探索非缺点和空间选择的效率。问:J. Exp。心灵。67.(10),2010-2024(2014)CrossRef谷歌学术
  51. 51。
    J. Oberem,V. Lawo,I. Koch,J. Fels,故意切换听觉选择性注意:探索在一个AneChice室中的不同双耳再现方法。Acta Acust。常规。One hundred.(6),1139-1148(2014)CrossRef谷歌学术
  52. 52。
    J.Rönnberg,T. Lunner,A. Zekveld,P.Sörqvist,H. Danielsson,B. Lyxell,o。Dahlström,C. Signoret,S. Stenfelt,M. K.Pichora-Fuler,M. Rudner,语言理解的易于理解(ELU)模型:理论,实证和临床进步。前面。系统。Neurosci。7.,31(2013)谷歌学术
  53. 53。
    N.RURNBERG,M. Rudner,T. Lunner,S. Stenfelt,通过测量短期内存存储和噪音语音的处理来评估听力努力。语音郎。听到。17(3),123-132(2014)CrossRef谷歌学术
  54. 54.
    约翰斯鲁德,J.M.罗德,增加处理需求的因素听演讲,在神经生物学的语言(Elsevier,Amsterdam,2016),PP。491-502谷歌学术
  55. 55.
    D. Kahneman,注意力和精力(Prentice-Hall, Englewood Cliffs, 1973)谷歌学术
  56. 56.
    A.F.桑德斯,朝向压力和人类性能的模型。acta心理斯。53(1), 61 - 97 (1983)CrossRef谷歌学术
  57. 57.
    压力和高负荷下人类表现调节的补偿控制:认知-能量框架。医学杂志。心灵。45(1-3),73-93(1997)CrossRef谷歌学术
  58. 58.
    A. Zuanazzi,U. Noppeney,添加剂和互动影响的空间关注和对感知决策的期望。SCI。代表。8.(1),6732(2018)谷歌学术
  59. 59.
    A.尊曲,U. Noppeney,不同的空间关注神经机制和期望指导在多福管世界中的感知推论。J. Neurosci。39(12),2301-2312(2019年)CrossRef谷歌学术
  60. 60。
    K. Allen,S. Carlile,D. Alais,谈判者特征的贡献和空间位置对听觉流媒体。j . Acoust。Soc。是。123(3),1562-1570(2008)CrossRef谷歌学术
  61. 61。
    R.S.鲍亚亚,W.T. Nelson,R.M.莫利,鸡尾酒会效果中的不对称性能:对空间音频显示器设计的影响。人类的事实。J. HUM。事实。ergon。SOC。43(2), 208 - 216 (2001)CrossRef谷歌学术
  62. 62。
    H. Gamper,T. Lokki,通过虚拟听觉显示,在电信中的音频增强现实第16届国际听觉展示会议(ICAD-2010),华盛顿,2010年,第63-71页谷歌学术
  63. 63。
    W.A.约斯特,R.H.戴伊,S.谢夫特,一个有三个声源的模拟“鸡尾酒会”。感知。Psychophys。58.(7),1026-1036(1996)CrossRef谷歌学术
  64. 64。
    多语者言语表现中影响可听懂度的因素。Int。j . Aviat。心灵。14(3), 313 - 334 (2004)CrossRef谷歌学术

版权信息

©作者,根据斯特普尔自然瑞士股份有限公司的独家许可188金宝搏beat官网

作者和附属机构

  1. 1.质量和可用性实验室柏林科技大学柏林德国

个性化的建议