Qué es SAM Audio, el nuevo modelo de IA de Meta

Esta tecnología tiene el potencial de transformar la edición de audio y video segmentando sonidos de mezclas de audio complejas.

17 de diciembre, 2025 | 20.34

La edición de audio acaba de dar un salto clave con la llegada de SAM Audio, un modelo de inteligencia artificial de última generación que permite segmentar y aislar sonidos específicos de una mezcla compleja de forma simple e intuitiva. Con esta tecnología, es posible extraer la voz de un cantante, una guitarra en vivo o eliminar ruidos molestos —como tráfico o ladridos— de un video o podcast con un solo clic o una indicación de texto. La herramienta de Meta forma parte de la familia Segment Anything y apunta a democratizar la separación de audio de nivel profesional.

Diseñado para reflejar cómo las personas piensan y trabajan con el sonido, SAM Audio simplifica procesos que antes requerían software especializado y mucha experiencia. Su potencial impacta de lleno en industrias como la música, el podcasting, la TV, el cine y la creación de contenidos digitales, además de abrir nuevas posibilidades en investigación científica y accesibilidad.

Cómo funciona SAM Audio

A diferencia de soluciones fragmentadas enfocadas en casos puntuales, SAM Audio es un modelo unificado que admite múltiples formas de interacción. Esto le permite adaptarse a escenarios reales con resultados de vanguardia. El sistema acepta tres tipos de indicaciones, que pueden usarse solas o combinadas:

  • Indicaciones de texto: escribir “voz cantando”, “guitarra eléctrica” o “ladrido de perro” para extraer ese sonido puntual.

  • Indicaciones visuales: hacer clic sobre la persona u objeto en un video que genera el audio que querés aislar.

  • Indicaciones de intervalo de tiempo: marcar el momento exacto en el que ocurre el sonido objetivo, una primicia en la industria.

Esta combinación brinda un control preciso e intuitivo sobre la separación del audio, reduciendo tiempos de edición y mejorando la calidad final.

SAM Audio simplifica procesos que antes requerían software especializado y mucha experiencia.

Casos de uso y disponibilidad

Las aplicaciones son amplias: aislamiento de pistas, filtrado de ruido, limpieza de grabaciones en exteriores, mejora de podcasts y creación de nuevas herramientas creativas para medios. De hecho, SAM Audio ya se está utilizando como base para desarrollar la próxima generación de soluciones de edición audiovisual.

Quienes quieran probarlo pueden hacerlo desde el Segment Anything Playground, una nueva plataforma donde se pueden usar recursos de audio y video preseleccionados o subir archivos propios. Además, el modelo está disponible para descarga, facilitando su integración en flujos de trabajo profesionales.

Con la incorporación del audio a la colección Segment Anything, SAM Audio se posiciona como uno de los modelos más completos de separación de sonido del mercado, marcando un antes y un después en la edición asistida por IA.