{"id":12687,"date":"2024-06-07T07:58:18","date_gmt":"2024-06-07T07:58:18","guid":{"rendered":"https:\/\/www.semantic-systems.com\/semantic-noticias\/?p=12687"},"modified":"2024-06-07T07:58:18","modified_gmt":"2024-06-07T07:58:18","slug":"la-irrupcion-de-las-tecnologias-del-lenguaje-en-la-industria","status":"publish","type":"post","link":"https:\/\/www.semantic-systems.com\/semantic-noticias\/articulos-tecnologicos\/la-irrupcion-de-las-tecnologias-del-lenguaje-en-la-industria\/","title":{"rendered":"La irrupci\u00f3n de las tecnolog\u00edas del lenguaje en la industria"},"content":{"rendered":"<p>Hablamos con Gorka Varela, Transferencia Tecnol\u00f3gica, en Vicomtech<br \/>\n&nbsp;<\/p>\n<h2>La Inteligencia Artificial y las tecnolog\u00edas del lenguaje, \u00bfpor qu\u00e9 est\u00e1 en boca de todos?<\/h2>\n<p>Dentro de lo que se conoce como Inteligencia Artificial (IA), la rama del Procesamiento del Lenguaje Natural (PLN) ha sufrido una explosi\u00f3n a ra\u00edz de la aparici\u00f3n de aplicaciones centradas en IA Generativa, suponiendo una publicidad de impacto y poniendo al descubierto las oportunidades que ofrecen estas tecnolog\u00edas dentro de diferentes aspectos de nuestras vidas (ocio, industria, administraci\u00f3n\u2026).<br \/>\n&nbsp;<br \/>\nDesde 2018 los LLM, Large Language Models o Modelos de Lenguaje de gran tama\u00f1o, ya empezaban a dar pistas sobre una revoluci\u00f3n tecnol\u00f3gica, que se dispar\u00f3 con la aparici\u00f3n de ChatGPT en noviembre de 2022, revolucionando el mundo de la IA aplicada al texto, ofreciendo capacidades de comprensi\u00f3n y generaci\u00f3n sorprendentes.<br \/>\n&nbsp;<br \/>\nEste boom tecnol\u00f3gico ha llevado a conseguir una democratizaci\u00f3n de la IA, es decir, hacerla accesible para que todos la tengamos presente en nuestro d\u00eda a d\u00eda, bien sea para crear contenido, para mejorar nuestra salud o para mejorar la productividad de una empresa.<br \/>\n&nbsp;<br \/>\nAdem\u00e1s, no solo se trata de la democratizaci\u00f3n del uso de la IA, tambi\u00e9n tiene impacto la democratizaci\u00f3n del desarrollo de la IA, dando soporte a que un mayor n\u00famero de personas participen en el dise\u00f1o y desarrollo, acelerando la innovaci\u00f3n y la posibilidad de aplicarlo en diferentes \u00e1mbitos.<br \/>\n&nbsp;<br \/>\n<div style=\"width: 1920px;\" class=\"wp-video\"><!--[if lt IE 9]><script>document.createElement('video');<\/script><![endif]-->\n<video class=\"wp-video-shortcode\" id=\"video-12687-1\" width=\"1920\" height=\"1080\" preload=\"metadata\" controls=\"controls\"><source type=\"video\/mp4\" src=\"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-content\/uploads\/2024\/05\/La-irrupci\u00f3n-de-las-tecnolog\u00edas-del-lenguaje-en-la-industria.mp4?_=1\" \/><a href=\"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-content\/uploads\/2024\/05\/La-irrupci\u00f3n-de-las-tecnolog\u00edas-del-lenguaje-en-la-industria.mp4\">https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-content\/uploads\/2024\/05\/La-irrupci\u00f3n-de-las-tecnolog\u00edas-del-lenguaje-en-la-industria.mp4<\/a><\/video><\/div><br \/>\n&nbsp;<\/p>\n<h2>Redes Neuronales, LLMs, Fine-Tuning, IA generativa\u2026Muchos conceptos en poco tiempo. \u00bfC\u00f3mo ha sido la evoluci\u00f3n de las tecnolog\u00edas del lenguaje?<\/h2>\n<p>Hoy en d\u00eda todos interactuamos con aplicaciones que trabajan con IA o con tecnolog\u00edas del lenguaje: traducciones, b\u00fasquedas, recomendaciones\u2026 y cada vez hay m\u00e1s aplicaciones disponibles que utilizan IA, pero esto no es algo nuevo, aunque la evoluci\u00f3n de los \u00faltimos a\u00f1os est\u00e1 siendo muy r\u00e1pida.<br \/>\n&nbsp;<br \/>\nExisten desarrollos previos, pero la llegada de las redes neuronales, all\u00e1 por el 2010 supuso un punto de inflexi\u00f3n. Se trata del proceso de Machine Learning llamado aprendizaje profundo, creando un sistema que aprende y mejora continuamente.<br \/>\n&nbsp;<br \/>\nTodo esto ha sido posible gracias al avance en la capacidad de c\u00f3mputo, y en concreto al desarrollo de las tarjetas gr\u00e1ficas, conocidas como GPUs, las cuales han permitido solventar una de las limitaciones existentes en el avance de las tecnolog\u00edas del lenguaje.<br \/>\n&nbsp;<br \/>\nTodo esto arranc\u00f3 con los videojuegos y con el objetivo de mejorar la representaci\u00f3n gr\u00e1fica, pero ha permitido avanzar con el hardware y desarrollar sistemas y modelos espec\u00edficos para el procesamiento del lenguaje.<br \/>\n&nbsp;<br \/>\nEsta capacidad de c\u00f3mputo ha permitido desarrollar los Grandes Modelos de Lenguaje o LLMs (Large Language Models), que son modelos de prop\u00f3sito general de Inteligencia Artificial, entrenados con millones de par\u00e1metros y desarrollados dentro del campo del Procesamiento del Lenguaje Natural que puede entender y generar texto al estilo humano. Los m\u00e1s relevantes son las diferentes versiones de GPT de OpenAI , BARD de Google o Llama de META. Como referencia, GPT-3 se lanz\u00f3 en 2020 con 175.000 millones de par\u00e1metros, pero ya en la versi\u00f3n GPT-4 se habla de billones de par\u00e1metros\u2026<br \/>\n&nbsp;<br \/>\nPero estos modelos grandes de lenguajes son de dominio general y es necesario hacer un fine-tuning o ajuste fino, que consiste en adaptar un modelo de prop\u00f3sito general a una tarea o dominio espec\u00edficos. Esto se consigue entrenando el LLM en un conjunto de datos m\u00e1s peque\u00f1o que sea relevante para la tarea en cuesti\u00f3n, por ejemplo, proporcionando un conjunto de instrucciones y respuestas ideales para permitir que la IA aprenda los patrones y matices de ese dominio espec\u00edfico.<br \/>\n&nbsp;<br \/>\nPor ejemplo, se podr\u00eda especializar un LLM mediante un conjunto de datos de historiales m\u00e9dicos para ayudar en los diagn\u00f3sticos m\u00e9dicos o un conjunto de datos de documentos jur\u00eddicos para proporcionar asesoramiento legal.<br \/>\nPero no nos podemos olvidar de la inteligencia artificial (IA) generativa, que se ha posicionado como una de las herramientas clave para la innovaci\u00f3n en el futuro. Desde su aparici\u00f3n a finales de 2022, herramientas como Chat GPT han puesto de manifiesto las posibilidades que ofrece esta tecnolog\u00eda.<br \/>\n&nbsp;<br \/>\nLa IA Generativa tiene la capacidad de crear nuevos contenidos en diversos formatos, como texto, im\u00e1genes, v\u00eddeos, audio y c\u00f3digo y supone un mundo de oportunidades para cualquier empresa.<br \/>\n&nbsp;<br \/>\nDiariamente salen nuevos avances y aplicaciones, pero los principales casos de uso se centran en: generaci\u00f3n de contenido, atenci\u00f3n al cliente, posicionamiento web, res\u00famenes y extracci\u00f3n de informaci\u00f3n, traducci\u00f3n, an\u00e1lisis del sentimiento, automatizaci\u00f3n de procesos, generaci\u00f3n de im\u00e1genes y videos, e incluso el desarrollo de c\u00f3digo inform\u00e1tico.<br \/>\n&nbsp;<\/p>\n<h2>Pero yo como empresa, \u00bfQu\u00e9 tengo que hacer si quiero aplicar IA en mis procesos o productos? \u00bfAprovecho los modelos disponibles o desarrollo modelos adaptados a mi necesidad?<\/h2>\n<p>Es importante tener claro el objetivo que perseguimos con la aplicaci\u00f3n de la IA, ya que las posibilidades son infinitas y podemos desviarnos de la necesidad que realmente queremos cubrir.<br \/>\n&nbsp;<br \/>\nActualmente existe la posibilidad de probar modelos gen\u00e9ricos de forma sencilla, pero los resultados que podamos obtener puede que no sean los esperados. Debemos tener en cuenta que un modelo gen\u00e9rico ha visto muchos par\u00e1metros, pero son de \u00e1mbito general.<br \/>\n&nbsp;<br \/>\nSe pueden utilizar modelos gen\u00e9ricos o desarrollar modelos espec\u00edficos adaptados con tus datos y tu caso de uso. El uso de modelos gen\u00e9ricos tiene la ventaja en la reducci\u00f3n de los tiempos de implantaci\u00f3n y uso, y un coste inicial menor, pero no tendremos posibilidad de personalizar o adaptar el modelo para optimizar los resultados. En cambio, si apostamos por el desarrollo de modelos espec\u00edficos, podremos adaptar la tecnolog\u00eda a nuestras necesidades, teniendo un mayor control, aunque incrementar\u00e1 los tiempos y la inversi\u00f3n inicial.<br \/>\n&nbsp;<br \/>\nNo hay una f\u00f3rmula m\u00e1gica que nos diga cual es la mejor opci\u00f3n, pero siempre hay opci\u00f3n de hacer peque\u00f1as pruebas de concepto que nos vayan dando pistas sobre el camino a seguir. Desde Vicomtech podemos ofrecer soporte en esta tarea de cara a definir y desarrollar la soluci\u00f3n que mejor se adapta a las necesidades de cada empresa.<br \/>\n&nbsp;<\/p>\n<h2>\u00bfCu\u00e1les son los retos de las Tecnolog\u00edas del Lenguaje para llegar a la industria?<\/h2>\n<p>El principal reto al que nos enfrentamos es la necesidad de adaptaci\u00f3n y optimizaci\u00f3n de los LLMs a cada caso espec\u00edfico de aplicaci\u00f3n, inyectando conocimiento de dominio con t\u00e9cnicas de aprendizaje basado en el contexto y\/o ajuste fino de modelos. Por ejemplo, podemos utilizar t\u00e9cnicas de IA como el RAG (Retrieval Augmented Generation o generaci\u00f3n mejorada por recuperaci\u00f3n) para dar soporte en la extracci\u00f3n de informaci\u00f3n de empresas nacionales l\u00edderes en movilidad sostenible, en la provisi\u00f3n de soluciones industriales avanzadas o en la fabricaci\u00f3n de componentes para autom\u00f3vil.<br \/>\n&nbsp;<br \/>\nEste tipo de empresas tambi\u00e9n muestran inter\u00e9s en desplegar este tipo de modelos on-premise, con el objetivo de asegurar la estanqueidad de sus datos y sistemas, para lo que la optimizaci\u00f3n de los LLMs adquiere especial relevancia.<br \/>\n&nbsp;<\/p>\n<h2>\u00bfQu\u00e9 tipo de tecnolog\u00edas y aplicaciones est\u00e1is trabajando para la industria?<\/h2>\n<p>Son varias las aplicaciones de las tecnolog\u00edas del lenguaje en la industria, que pueden ir desde la interacci\u00f3n por voz o la gesti\u00f3n de grandes vol\u00famenes de informaci\u00f3n.<br \/>\n&nbsp;<br \/>\nLa voz es la forma m\u00e1s natural de comunicaci\u00f3n entre las personas, pero cuando se trata de comunicarnos con las m\u00e1quinas o sistemas nos cuesta dar el paso. La realidad es que cada vez m\u00e1s empresas muestran inter\u00e9s en esta posibilidad que ofrece la IA, ya que nos permite adem\u00e1s de facilitar la interacci\u00f3n, poder hacerla m\u00e1s accesible a trabajadores que cuenten con alguna discapacidad. Llevar esto a la industria tiene ciertos retos, como puede ser el lenguaje espec\u00edfico que se utiliza en cada sector o \u00e1mbito, para lo que ser\u00e1 necesario recopilar dato y adaptar el modelo. Adem\u00e1s, tenemos el ruido ambiental, para lo que los sistemas de captura han mejorado much\u00edsimo o la necesidad de que los modelos funcionen en equipos \u201cnormales\u201d, es decir, que no necesiten una GPU para poder ejecutar la IA, pero gracias a la posibilidad de adaptaci\u00f3n y de optimizaci\u00f3n existente, es posible superar estos retos y aplicar la IA en nuestro procesos, productos y servicios.<br \/>\n&nbsp;<br \/>\nPor otro lado, cada vez m\u00e1s empresa ven la potencialidad de la IA y de las tecnolog\u00edas del lenguaje para procesar gran cantidad de informaci\u00f3n, que puede venir de diferentes fuentes y en diferentes formatos, como pueden ser pliegos o licitaciones de gran tama\u00f1o, donde se pueden aplicar tecnolog\u00edas de extracci\u00f3n y de b\u00fasqueda de informaci\u00f3n mucho m\u00e1s potentes que las existente hasta hace poco, mejorando los procesos internos de oferta, administraci\u00f3n o gesti\u00f3n.<br \/>\n&nbsp;<\/p>\n<h2>El avance en la IA Generativa ha ido desde el texto, a la imagen y ya estamos viendo modelos de IA generativa de video, \u00bfpero se pueden combinar?<\/h2>\n<p>La IA multimodal es una tendencia global, es un tipo de inteligencia artificial (IA) que puede procesar, comprender y\/o generar resultados para m\u00e1s de un tipo de datos.<br \/>\n&nbsp;<br \/>\nBrinda amplias oportunidades como pueden ser la generaci\u00f3n de dato sint\u00e9tico para anal\u00edtica de datos en salud, la detecci\u00f3n de riesgos de ciberseguridad, el aseguramiento de calidad industrial o el entrenamiento de modelos de conducci\u00f3n aut\u00f3noma.<br \/>\n&nbsp;<br \/>\nA este nivel, desde Vicomtech estamos participando actualmente en el proyecto europeo LUMINOUS (http:\/\/luminous-horizon.eu\/) en el que estamos investigando el futuro de los sistemas de realidad extendida aumentados gracias a los LLMs, los grandes modelos de lenguaje.<br \/>\n&nbsp;<\/p>\n<hr \/>\n<p>&nbsp;<br \/>\n&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hablamos con Gorka Varela, Transferencia Tecnol\u00f3gica, en Vicomtech &nbsp; La Inteligencia Artificial y las tecnolog\u00edas del lenguaje, \u00bfpor qu\u00e9 est\u00e1 en boca de todos? Dentro de lo que se conoce como Inteligencia Artificial (IA), la rama del Procesamiento del Lenguaje Natural (PLN) ha sufrido una explosi\u00f3n a ra\u00edz de la aparici\u00f3n de aplicaciones centradas en [&hellip;]<\/p>\n","protected":false},"author":7,"featured_media":12689,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7,55],"tags":[70],"class_list":["post-12687","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-articulos-tecnologicos","category-podcast","tag-inteligencia-artificial"],"_links":{"self":[{"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/posts\/12687","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/comments?post=12687"}],"version-history":[{"count":5,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/posts\/12687\/revisions"}],"predecessor-version":[{"id":12749,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/posts\/12687\/revisions\/12749"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/media\/12689"}],"wp:attachment":[{"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/media?parent=12687"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/categories?post=12687"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.semantic-systems.com\/semantic-noticias\/wp-json\/wp\/v2\/tags?post=12687"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}