首页 >> 生活 >

使用skyrmion水库进行音频分类

2023-03-28 14:51:33 来源: 用户: 

“七、一、九、……”:人声发音数字,物理材料识别它们的准确率约为97%。该模式识别系统由杜伊斯堡-埃森大学(UDE)的物理学家与根特大学(比利时)合作开发。这一发展使多维问题得以快速解决,而无需耗费精力的培训。《高级智能系统》杂志发表了这一结果。

无生命材料是否有可能快速有效地识别模式?这是由KarinEverschor-Sitte教授领导的一组理论物理学家提出的问题。为了证明他们的观点,研究人员使用了语音识别。

该团队,包括作为第一作者的RobinMsiska,使用了标准数据库中0到9范围内的语音数字录音。物理学家分析了每个说话时刻所涉及的频率类型和强度。随后,他们将此信息转换为电压信号,并通过39个触点将其施加到磁性薄膜上。

这种薄膜材料包含通过变形对电压作出反应的小磁涡流(斯格明子)。“简单地说,你可以把它想象成一个黑白网格图案,它会根据输入信号改变形状,”Msiska解释道。因此,该材料为每个语音数字形成了独特的模式——就像二维码——可以用简单的方法线性读出。

该团队的研究利用了复杂的模拟,主要是在佛兰芒超级计算机中心(VlaamsSupercomputerCentrum)与根特大学合作进行的。他们的材料系统正确识别了97.4%的数字。仅检查女性声音,这个数字上升到98.5%。Everschor-Sitte报告说:“这显示了材料内储层计算机有史以来的最佳性能。”它在最小的空间内这样做;物理学家研究的样品边长只有一微米。

“如果使用神经网络,训练成本高昂并且需要庞大的数据集。我们的材料系统可以解决机器学习问题,而无需构建数百万个互连神经元的系统——这里显示的语音识别只是一个例子。它速度更快,使用更少能量,”物理学家解释道。

在她看来,可以在需要检测和解释各种信号的地方找到潜在的应用:自动驾驶、天气预报或医疗环境。与UDE的其他研究人员合作,他们目前的重点是标准医学检查:脑电图(EEG),用于测量大脑的电活动。物理学家正在研究磁系统是否可以独立解释这些结果。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章