Betterdata utiliza datos sintéticos para proteger datos reales


Betterdata, una startup con sede en Singapur que utiliza datos sintéticos programables para proteger datos reales, anunció hoy que ha recaudado 1,55 millones de dólares. La ronda inicial, que según se informa tuvo un exceso de suscripciones, fue dirigida por Investible con la participación de Franklin Templeton, Xcel Next, la Universidad de Tecnología y Diseño de Singapur, Bon Auxilium, Tenity, Plug and Play y Entrepreneur First.

La startup fue fundada en 2021 por el Dr. Uzair Javaid, su CEO y el tecnólogo en jefe Kevin Yee con el objetivo de hacer que el intercambio de datos sea más rápido y seguro frente a las crecientes regulaciones de protección de datos en todo el mundo. Actualmente, la empresa tiene asociaciones de investigación y desarrollo con dos importantes universidades de Singapur y Estados Unidos (no puede revelar públicamente quiénes son), y entre sus clientes se incluye el Shanghai Pudong Development Bank.

Betterdata dice que se diferencia de los métodos tradicionales de intercambio de datos que utilizan la anonimización de datos para destruir datos porque en su lugar utiliza inteligencia artificial generativa e ingeniería de privacidad.

Yee le explicó a TechCrunch que los datos sintéticos programáticos usan modelos generativos, como modelos de aprendizaje profundo, incluidos modelos adversarios generativos usados ​​en deepfakes, transformadores usados ​​en ChatGPT y modelos de difusión usados ​​en difusión estable, para crear y expandir nuevos conjuntos de datos.

Estos conjuntos de datos sintéticos tienen propiedades y estructuras similares a los datos del mundo real, sin revelar información confidencial o privada sobre las personas.

"La idea es crear una versión ficticia de un conjunto de datos real que se pueda usar de manera segura para una variedad de propósitos, incluida la protección de datos confidenciales, la reducción de sesgos y también la mejora de los modelos de aprendizaje automático", dijo.

Los datos sintéticos programáticos ayudan a los desarrolladores de muchas maneras. Algunos ejemplos incluyen ayudar a proteger datos confidenciales, cumplir con las regulaciones de privacidad como GDPR e HIPAA, aumentar la disponibilidad de datos entre equipos, crear más datos para capacitación, probar y validar modelos de aprendizaje automático, y solucionar problemas de desequilibrio de datos mediante la creación de más registros para grupos subrepresentados o clases

La financiación de Betterdata se utilizará para lanzar y mejorar su pila de tecnología de datos sintéticos programables, incluida la compatibilidad con conjuntos de datos de una sola tabla, varias tablas y series temporales. Estas son diferentes variaciones de conjuntos de datos tabulares, y Yee explica que las principales diferencias radican en sus estructuras y los problemas para los que están diseñados.

Por ejemplo, los conjuntos de datos de una sola tabla se enfocan en tablas independientes, los conjuntos de datos de varias tablas están destinados a considerar las relaciones entre varias tablas y los conjuntos de datos de series temporales están destinados a manejar los datos recopilados a lo largo del tiempo.

Betterdata también planea contratar más empleados, incluido el personal de ventas y marketing, y expandirse más allá de Singapur a otras regiones de Asia Pacífico durante el próximo año o dos.

En un comunicado sobre la inversión de Investible, el director Khairu Rejal dijo: "Betterdata resuelve uno de los mayores problemas que enfrenta la industria de la IA en la actualidad: la falta de datos de alta calidad que también cumplan con los requisitos de privacidad. A través de su poderosa plataforma, Betterdata genera datos sintéticos que imitan los datos del mundo real sin sacrificar la calidad y la privacidad, ayudando a las organizaciones a cumplir con las leyes de privacidad y cumplimiento global a escala”.

Si quieres conocer otros artículos parecidos a Betterdata utiliza datos sintéticos para proteger datos reales puedes visitar la categoría Noticias.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir