sound-source-localization

Star

Here are 25 public repositories matching this topic...

aishoot / Sound_Localization_Algorithms

Star

Classical algorithms of sound source localization with beamforming, TDOA and high-resolution spectral estimation.

beamforming microphone-array esprit sound-localization multiple-signal-classification mvdr sound-source-localization

Updated Oct 26, 2019
Jupyter Notebook

Audio-WestlakeU / RealMAN

Star

A description of "RealMAN: A Real-Recorded and Annotated Microphone Array Dataset for Dynamic Speech Enhancement and Localization" [NeurIPS 2024]

multi-channel speech-enhancement microphone-array-processing doa-estimation audio-datasets sound-source-localization microphone-audio-capture real-world-datasets

Updated Apr 29, 2025
Python

Audio-WestlakeU / FN-SSL

Star

The Official PyTorch Implementation of FN-SSL & IPDnet for Sound Source Localization [INTERSPEECH2023 & TASLP2024]

speech narrow-band sound-source-localization microphone-array-generalization

Updated Dec 9, 2024
Python

BrownsugarZeer / Multi_SSL

Star

Combine sound source separation with SRP-PHAT to achieve multi-source localization.

ssl duet bss srp-phat sound-source-localization sound-source-separation

Updated Jan 22, 2025
Python

BingYang-20 / SRP-DNN

Star

A python implementation of “SRP-DNN: Learning Direct-Path Phase Difference for Multiple Moving Sound Source Localization” [ICASSP 2022]

deep-learning srp multi-channel source-detection crnn ipd doa-estimation sound-source-localization azimuth-angle elevation-angle direct-path

Updated Sep 28, 2024
Python

stoneMo / DeepAVFusion

Star

Official codebase for "Unveiling the Power of Audio-Visual Early Fusion Transformers with Dense Interactions through Masked Modeling".

attention-mechanism multimodal-learning self-supervised-learning sound-source-localization transformer-architecture audio-visual-correspondence audio-visual-learning masked-autoencoder sound-source-separation masked-image-modeling

Updated Aug 2, 2024
Python

BingYang-20 / DP-RTF-Learning

Star

A python implementation of “Learning Deep Direct-Path Relative Transfer Function for Binaural Sound Source Localization” [TASLP 2021]

deep-learning multi-channel crnn ipd doa-estimation binauralaudio ild sound-source-localization azimuth-angle microphone-array-generalization direct-path

Updated Feb 11, 2023
Python

ishaaniwani / GCC-PHAT-SSL

Star

MATLAB Simulation Framework For Basic Sound Source Localization Using the GCC PHAT Algorithm

signal-processing matlab sound-source-localization

Updated Jun 25, 2019
MATLAB

RobertoAlessandri / CNN_DOA

Star

Test of the ability of a Convolutional Neural Network (CNN) trained to localize the Direction Of Arrival (DOA), to generalize in different environments.

deep-learning cnn sound-source-localization room-impulse-responses

Updated Jul 14, 2022
Jupyter Notebook

axeber01 / wav2pos

Star

3D Sound Source Localization using Masked Autoencoders

sound-source-localization

Updated Feb 12, 2025
Jupyter Notebook

BingYang-20 / TF-Wise-Spatial-Spectrum-Clustering

Star

A MATLAB implementation of “Multiple Sound Source Counting and Localization Based on TF-Wise Spatial Spectrum Clustering” [TASLP 2019]

clustering source-detection doa-estimation spatial-correlation sound-source-localization azimuth-angle spatial-spectrum

Updated Oct 23, 2023
MATLAB

sutdcv / Chaotic-World

Star

[ICCV2023] Chaotic World: A Large and Challenging Benchmark for Human Behavior Understanding in Chaotic Events

dataset human-behavior-understanding sound-source-localization long-tailed-distribution iccv2023 spatiotemporal-action-localization behavioral-graph-analysis spatiotemporal-event-grounding spatiotemporal-video-grounding

Updated Dec 7, 2024

stoneMo / OneAVM

Star

Official Codebase of "A Unified Audio-Visual Learning Framework for Localization, Separation, and Recognition" (ICML 2023)

multimodal-learning self-supervised-learning sound-source-localization audio-visual-correspondence audio-visual-learning sound-source-separation

Updated Jun 1, 2023

ZahraBenslimane / sound_source_localization_with_beamforming

Star

Localization of a sound source using a microphone array and beamforming technics

python signal-processing beamforming microphone-array sound-source-localization

Updated Apr 16, 2023
Jupyter Notebook

linfeng-feng / Unbiased_Label_Distribution

Star

Eliminating Quantization Errors in Classification-Based Sound Source Localization

sound-source-localization quantization-error soft-label

Updated Jan 10, 2025
Python

wattai / sound-source-position-estimation

Sponsor

Star

This scripts estimate Sound Source Position based on Cross-power Spectrum Phase (CSP) or Multiple Signal Classification (MUSIC).

python science sound-processing audio-processing sound-source-localization sound-engineering

Updated Nov 23, 2024
Python

ly-zhu / Leveraging-Category-Information-for-Single-Frame-Visual-Sound-Source-Separation

Star

PyTorch implementation of "Leveraging Category Information for Single-Frame Visual Sound Source Separation"

sound-separation sound-source-localization audio-visual-learning appearance-attention

Updated Aug 1, 2021
Python

ly-zhu / cof-net

Star

Code for the paper: Visually Guided Sound Source Separation using Cascaded Opponent Filter Network

self-supervised-learning sound-source-localization audio-visual-learning sound-source-separation audio-visual-sound-separation multi-model-learning

Updated Apr 19, 2022
Python

ly-zhu / ly-zhu.github.io

Star

Projects webpage

machine-learning computer-vision representation-learning semantic-segmentation self-supervision sound-source-localization portrait-segmentation audio-visual-learning audio-visual-applications sound-source-separation

Updated Sep 25, 2022
HTML

This project develops an autonomous hexapod robot using auditory scene analysis for navigation. It integrates sound source localization (DOA) and beamforming via ODAS with a circular microphone array for precise spatial detection. A machine learning-based Keyword Spotting (KWS) module enables voice command recognition for human-robot interaction.

raspberry-pi machine-learning robotics hexapod keyword-spotting beamforming microphone-array doa odas acoustic-scene-classification sound-source-localization human-machine-interaction computer-audition

Updated May 8, 2025
Python

Improve this page

Add a description, image, and links to the sound-source-localization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the sound-source-localization topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sound-source-localization

Here are 25 public repositories matching this topic...

aishoot / Sound_Localization_Algorithms

Audio-WestlakeU / RealMAN

Audio-WestlakeU / FN-SSL

BrownsugarZeer / Multi_SSL

BingYang-20 / SRP-DNN

stoneMo / DeepAVFusion

BingYang-20 / DP-RTF-Learning

ishaaniwani / GCC-PHAT-SSL

RobertoAlessandri / CNN_DOA

axeber01 / wav2pos

BingYang-20 / TF-Wise-Spatial-Spectrum-Clustering

sutdcv / Chaotic-World

stoneMo / OneAVM

ZahraBenslimane / sound_source_localization_with_beamforming

linfeng-feng / Unbiased_Label_Distribution

wattai / sound-source-position-estimation

ly-zhu / Leveraging-Category-Information-for-Single-Frame-Visual-Sound-Source-Separation

ly-zhu / cof-net

ly-zhu / ly-zhu.github.io

Gl0dny / hexapod

Improve this page

Add this topic to your repo