使用相控阵麦克风进行 3D 音频成像

还记得《银翼杀手》中德卡德将照片放入照片检查器中的场景吗？虚拟相机可以在拍摄的场景中平移和移动，从而提取出不可能的细节。看起来 [Ben Wang] 发现了如何使这个特殊的技巧成为现实，但是需要音频而不是视频。秘密武器不是一个复杂的麦克风，而是一大堆非常简单的麦克风。在本例中，共有 192 个，排列在长 PCB 上，充当墙壁艺术轮的辐条。完全是对话片段。

您可能会认为同时捕获 192 个麦克风的数据本身就是一个挑战，但这似乎是一个准确的评估。第一个数据采集问题是由于奇怪的 PCB 将制造过程推向了极限。大约一半的辐条在到达时就已损坏，各个麦克风倾向于将共享时钟线短路至接地线或电源线。然后将所有数据拉入，色光用作具有方便外形尺寸的通用 FPGA。由于开源逆向工程的努力，这种前像素控制器可用于各种项目，甚至得到网格项目工具链，也用于这项工作。

将所有这些麦克风打包成 UDP 数据包最终会达到高达 715 Mbps，这非常适合千兆位以太网连接。该数据被输入到用以下代码编写的 GPU 内核中 Triton，CUDA 的开源替代品。这将执行两个波束成形操作之一。近场波束成形将麦克风阵列正前方的空间划分为 64 厘米体素的 64x64x5 网格，并且可以在该 3d 空间中定位声源。或者，系统可以运行远场波束成形，并在 2×512 网格上的 512d 方向上定位声源。

作为校准的一部分，声速也是一个参数，经过优化以获得系统的最佳模型，这使得整个过程就像一个过度设计的温度计。

最令人印象深刻的技巧是以另一种方式运行该过程，并隔离来自特定方向的传入音频。这里的演示是播放来自一个源的静态声音，以及来自附近第二个源的音乐。当仅使用一个麦克风收听时，结果是一团乱码。但应用波束成形算法在隔离定向音频方面取得了令人印象深刻的效果。点击查看结果.

如果这还不够，请查看以下详细信息另一个类似的麦克风阵列项目.

SEO 支持的内容和 PR 分发。今天得到放大。
PlatoData.Network 垂直生成人工智能。赋予自己力量。访问这里。
柏拉图爱流。 Web3 智能。知识放大。访问这里。
柏拉图ESG。汽车/电动汽车，碳，清洁科技, 能源，环境，太阳能，废物管理。访问这里。
块偏移量。现代化环境抵消所有权。访问这里。
Sumber: https://hackaday.com/2023/07/04/3d-audio-imaging-with-a-phased-array-microphone/

生成数据智能

使用相控阵麦克风进行 3D 音频成像

供应商注册后续

MtGox 准备在 142,000 月 143,000 日之前释放 31 BTC 和 XNUMX BCH

最新情报

数据显示，投资者押注 Solana，SOL 投资产品引领山寨币流入

比特币流动性转向山寨币：山寨币季预计在 2-3 个月内出现

DENSO 和 Certhon 推出全自动樱桃桁架番茄收获机器人 Artemy

NCVPS 实时信息网络研讨会

咆哮的小猫是谁，他的回归对加密货币意味着什么？ – 解密

咆哮的小猫是谁，他的回归对加密货币意味着什么？ – 解密