¿Cómo funciona ChatGPT? La revolución de la Inteligencia Artificial


El estado actual de CHAT GPT no ha surgido de la noche a la mañana, si no que ha sido el fruto de décadas de innovaciones en el mundo de la tecnologia como la programación, informática, IAs y la sociedad en si, esto es lo que se conoce como una tecnologia convergente, es decir que nace de otras muchas tecnologías.

Chat GPT está basado en GPT3 (Generative Pre-Trained Trasnformer 3), GPT3 es un modelo, un modelo es un programa, algoritmo, función que trata de replicar el funcionamiento de un sistema, como modelo climático que es un programa que permite predecir el clima basándose en datos históricos.

GPT es un modelo de lenguaje generativo basado en redes neuronales, está diseñado para conocer e identificar partes de nuestro idioma, similar al autocompletar del móvil, pero al funcionar tan bien parece que realmente entiende lo que genera

Mientras que GPT completa texto Chat GPT Es un predictor de palabras que está condicionado para tener en cuenta que nuestro texto es una pregunta o la intervención de una persona en un chat y la respuesta que genera es la cadena de palabras que más probabilidad tienen de aparecer a continuación.

Interacción:

La gran revolución de los modelos como Chat GPT es poder interactuar con la maquina mediante lenguaje natural como nos comunicaríamos con otro humano, hasta ahora cuando queríamos interactuar con una maquina como un ordenador había que utilizar código de programación, que permitía interactuar, pero con una estructura muy rígida, por ejemplo, al utilizar una calculadora hay que seguir un orden muy preciso de acciones y en caso de cometer un error borrar el valor y volver a empezar.

Las redes neuronales:

son programas diseñados para aprender a hacer tareas, programar tareas como operaciones básicas en una calculadora resulta sencillo, sin embargo, a la hora de programar tareas mucho más complejas como reconocer objetos en una imagen pese a ser una tarea sencilla para un humano, resulta muchísimo más complejo de programar paso a paso para que sea capaz de llevarlo a cabo una máquina.

Aprendizaje automático:

debido a la dificultad de programar tareas complejas de desarrollo el aprendizaje automático o machine learning, las redes neuronales son una de las tecnologías para llevar a cabo esto.

La idea consiste en que al no saber cómo programar un modelo para que realice una tarea concreta, se le proporcionan referencias a la red neuronal, para que sepa el tipo de datos, como analizarlos, que operaciones realizar sobre ellos para sacar conclusiones.

Es decir, se le proporcionan datos y una estrategia para analizarlos, pero es el modelo el encargado de estudiar los datos para entender procesarlos y analizarlos encontrando patrones que incluso no somos capaces de reconocer, este proceso se denomina entrenamiento.