Ubuntu

IA en telecomunicaciones: una descripción general para científicos de datos

IA en telecomunicaciones: una descripción general para científicos de datos

He visto a muchos científicos de datos junior e ingenieros de aprendizaje automático comenzar un nuevo trabajo o un compromiso de consultoría para una empresa de telecomunicaciones que proviene de diferentes industrias y piensan que es otro proyecto como muchos otros. Lo que normalmente no saben es que “¡Es una trampa!”.

Pasé varios años transformando datos de telecomunicaciones en información valiosa y, mirando hacia atrás, hay un par de cosas que me hubiera encantado saber al comienzo de mi viaje. Independientemente de la parte de la empresa de telecomunicaciones en la que esté trabajando, ya sea la optimización de la red de radio, el monitoreo del tráfico y la detección de anomalías, o la detección y prevención de abandonos, el problema al que se enfrentará de inmediato es el acceso a las fuentes de datos.

¿Dónde guardar los datos?

Probablemente esté acostumbrado a un gran conjunto de datos que reside en un depósito en AWS o Azure. Desafortunadamente, en muchos casos, un operador móvil no tiene la opción de usar la nube pública, ya sea por regulaciones locales o por razones de seguridad. Esto hace que sea muy difícil utilizar herramientas modernas como Google Big Query. En la mayoría de los casos, las bases de datos que consideraría «heredadas» y demasiado costosas siguen siendo cruciales para conectar una llamada de voz. Puede pensar, “¡Ja! Tengo una computadora de escritorio potente con las 4 últimas GPU nVidia, así que no hay problema ”. Si bien esto puede ser cierto cuando se trabaja en un entorno de oficina seguro, cuando se trabaja desde casa es imposible descargar datos relacionados con el cliente en su máquina local, incluso con PII anonimizados.

Solo usa Kubernetes

Ok, entonces, ¿cuál es una solución viable? Cada operador de telefonía móvil está estudiando las funciones de red virtual (VNF) y las funciones de red en contenedores (CNF). Los CNF aún no ven un uso de producción amplio, pero definitivamente puede encontrar un entorno de Kubernetes en la red. Dado que se planea usar Kubernetes como una plataforma CNF, debe estar bien conectado con otros sistemas importantes, asegurado adecuadamente, etc. Cuando obtenga acceso a este entorno, puede usar KubeFlow, una solución de ML Ops en contenedores que proporciona una solución sencilla manera de implementar los mejores sistemas de código abierto para el aprendizaje automático en diversas infraestructuras. Gracias a los encantos, puede instalar KubeFlow con un solo comando.

Después de la instalación, puede acceder a su portátil Jupyter familiar, a la aceleración del kit de herramientas nVidia, así como a todas las demás herramientas y marcos populares. Kubeflow es también una plataforma completa de ML Ops, que le permite crear canalizaciones de datos y producir modelos. Puede pensar ahora: “¡Está bien, un comando y estoy listo para trabajar!”, Pero recuerde … ¡Es una trampa! En realidad, ahora puede tener un entorno en el que trabajar, pero le faltan los conjuntos de datos.

Ejemplo de redes autoorganizadas

El siguiente escollo son los datos en sí. Para reducirlo, centrémonos en las redes autoorganizadas o SON, uno de los casos de uso en los que se utiliza el aprendizaje automático en las telecomunicaciones. En pocas palabras, SON es una tecnología de automatización diseñada para acelerar y simplificar la planificación, configuración, gestión, optimización y reparación de las redes de acceso de radio móvil. Cuando trabaje en SON, tocará tres áreas principales: autooptimización, autorreparación y autoconfiguración. En todos estos casos, sus datos principales serían la configuración actual e histórica, alarmas provenientes de elementos de red, métricas de rendimiento de radio en tiempo real, KPI agregados y una tonelada de metadatos. Para todos y cada uno de los tipos de datos, tendría que encontrar una única fuente de verdad. Esto puede ser difícil porque la mayoría de las redes suelen tener dos o más proveedores con formas ligeramente diferentes de configurar y monitorear sus equipos. Afortunadamente, la mayoría de las redes también tienen un sistema de nivel general que recopila y transforma datos en un formato común. Si no está trabajando en algo que necesita optimizarse en tiempo real, esta sería su fuente de datos.

Productizando el modelo con Kubeflow

Ahora que desarrolló su nuevo modelo, es hora de probarlo. Si ha elegido la ruta de Kubeflow, puede servir un modelo como punto final a través de cualquiera de los módulos de servicio (KFServing).

También puede exportar un contenedor de Docker para que su equipo de DevOps ejecute su modelo en un entorno de prueba. El superpoder de Charmed Kubernetes es la posibilidad de relacionar encantos entre sí. Supongamos que tiene algunos de sus datos en ElasticSearch y desea servirlos usando Kafka porque así es como su destino VNF recibe instrucciones. Si no es competente con DevOps, puede resultar complicado configurarlo. Sin embargo, con los encantos, puede relacionar componentes con un solo comando y lograr una configuración como esta en cuestión de minutos:

Usar Kubeflow como su entorno de trabajo es un gran ahorro de tiempo y la mejor opción para los científicos de datos que trabajan en el espacio de las telecomunicaciones. Le permite concentrarse en lo que es importante: trabajar en su modelo para ofrecer más valor o más limpieza de datos, dependiendo de si ve un vaso medio lleno o vacío.UN


Si eres un profesional de datos que trabaja en el espacio de las telecomunicaciones, también te animo a que te unas a las discusiones de OpenRAN, especialmente en un subgrupo: Inteligencia y automatización de RAN (RIA) donde puede influir en el futuro del aprendizaje automático en las telecomunicaciones.

Leave a Comment

You may also like