GPT-4: Esto es lo que puede hacer el modelo multimodal

El lanzamiento de ChatGPT fue favorecido por los socios de cooperación de Microsoft. El grupo tecnológico ha ensamblado decenas de miles de chips Nvidia A100 e incluso ha realizado ajustes en el servidor para proporcionar una supercomputadora que, según la empresa, puede haber costado varios cientos de millones de dólares estadounidenses. Capilla NidhiGerente general de Microsoft para la infraestructura de IA de Azure, explicó a Bloombergque esta base técnica hizo posible el lanzamiento de OpenAIs ChatGPT en primer lugar:

Construimos una arquitectura de sistema que podría operar y ser confiable a gran escala. Eso es lo que hizo que ChatGPT fuera posible. Ese es un modelo que salió de ahí. Habrá muchos, muchos otros.

ChatGPT también está optimizado con GPT-4. OpenAI proporciona acceso al modelo a través de ChatGPT ya través de la API. Sin embargo, las partes interesadas deben, como de costumbre, registrarse en una lista de espera; sin embargo, los primeros desarrolladores ya están accediendo. Entonces pueden aprovechar y probar las muchas opciones, a veces inimaginables, que ha presentado la empresa. Durante seis meses, OpenAI ha estado trabajando para personalizar GPT-4 y prepararlo para su lanzamiento. Ahora el modelo está aquí y, según el sitio web de la compañía, es tan poderoso que puede manejar incluso consultas complejas e incluso dominar exámenes difíciles con gran éxito. En el sitio web es[llamado:[called:

GPT-4 es un gran modelo multimodal (que acepta entradas de imágenes y texto, y emite salidas de texto) que, si bien es menos capaz que los humanos en muchos escenarios del mundo real, exhibe un rendimiento a nivel humano en varios puntos de referencia académicos y profesionales. Por ejemplo, aprueba un examen de barra simulado con una puntuación de alrededor del 10 % superior de los examinados; por el contrario, la puntuación de GPT-3.5 se situó en torno al 10 % inferior.

GPT-4 funciona muy bien cuando se trata de pruebas, © OpenAI
GPT-4 funciona muy bien cuando se trata de pruebas, © OpenAI

Además, el modelo debería superar a otros modelos lingüísticos principales en muchos aspectos, incluso en contextos lingüísticos distintos del inglés:

En los 24 de los 26 idiomas probados, GPT-4 supera el rendimiento en inglés de GPT-3.5 y otros LLM (Chinchilla, PaLM), incluso para idiomas de bajos recursos como letón, galés y swahili.

5 ejemplos de usos sorprendentes de GPT-4

Algunos ejemplos presentados por OpenAI muestran lo que GPT-4 puede hacer por los vendedores, usuarios privados y compañía en un contexto práctico. El modelo de IA ahora puede procesar e interpretar entradas de imágenes, y también entiende el humor. Entonces, OpenAI le mostró al modelo la siguiente imagen con la pregunta y el mensaje: “¿Qué tiene de gracioso esta imagen?” Descríbelo panel por panel.

En respuesta, GPt-4 proporcionó la siguiente explicación:

La imagen muestra un paquete para un adaptador ‘Lightning Cable’ con tres paneles.

Panel 1: un teléfono inteligente con un conector VGA (un conector azul grande de 15 pines que generalmente se usa para monitores de computadora) conectado a su puerto de carga.

Panel 2: El paquete del adaptador ‘Lightning Cable’ con una imagen de un conector VGA.

Panel 3: un primer plano del conector VGA con un pequeño conector Lightning (utilizado para cargar iPhones y otros dispositivos Apple) al final.

El humor en esta imagen proviene de lo absurdo de enchufar un conector VGA grande y obsoleto en un puerto de carga de teléfono inteligente pequeño y moderno.

Pero las posibilidades van mucho más allá del análisis de imágenes. Con la ayuda de GPT-4, los usuarios pueden incluso convertir automáticamente una breve nota escrita a mano en un sitio web creado por la IA.

El usuario de Twitter McKay Wrigley llama a la opción: “Un vistazo al futuro de la informática”. Pero eso no es todo. GPT-4 también puede ayudarlo a codificar. E incluso si ocurre un error, la IA puede ser informada al respecto a través de un aviso y lo identifica y corrige. El experto en marketing Tobias Eickelpasch presentó esta opción en LinkedIn junto con otros escenarios de aplicación y está entusiasmado. También documenta que GPT-4 puede incluso hacer la declaración de impuestos por usted.

Esto ya es un soporte muy útil para el uso diario. El modelo tiene más que ofrecer cuando se aplica a diferentes escenarios. El CEO de DoNotPay, una red social que ofrece apoyo a quienes buscan ayuda en casos legales, explica que la empresa utiliza GPT-4 y está trabajando en las llamadas demandas de un clic para tomar medidas contra las personas que llaman spam.

GPT-4 apoya indirectamente a más personas que necesitan ayuda. La aplicación Be My Eyes, que conecta a las personas ciegas y con discapacidad visual con otras y les ofrece apoyo, ahora también utiliza el modelo multimodal. Con el Voluntario Virtual, la aplicación puede proporcionar una herramienta que explica varias imágenes al usuario, responde preguntas sobre ellas y ofrece ayuda en tiempo real.

Las posibilidades son extremadamente diversas: puede ver aún más en el video de demostración

Los ejemplos mencionados solo cubren una fracción de lo que GPT-4, también en combinación con ChatGPT o Bing, es capaz de hacer. Los posibles usos aparecen más diversos que nunca; y en el marco de varias herramientas de IA, este modelo (junto con otros de Google, Meta y Co.) cambiará la industria digital para siempre. Esto tendrá un impacto en el marketing, en la educación, en la vida digital cotidiana de las personas.

GPT-4, al igual que el modelo anterior, todavía tiene limitaciones explicadas IA abierta:

A pesar de sus capacidades, GPT-4 tiene limitaciones similares a las de los modelos GPT anteriores. Lo que es más importante, todavía no es completamente confiable (‘alucina’ hechos y comete errores de razonamiento). Se debe tener mucho cuidado al usar los resultados del modelo de lenguaje, particularmente en contextos de alto riesgo, con el protocolo exacto (como revisión humana, puesta a tierra con contexto adicional o evitar usos de alto riesgo por completo) que coincida con las necesidades de un caso de uso específico. .

Y una entrada de video, como anunció poco antes del lanzamiento Andreas Braun, CTO Microsoft Alemania y Lead Data & AI STU, aún no es una opción. Si se agrega esta opción, también debería cambiar la forma en que se usa la inteligencia artificial en el contexto de las redes sociales como TikTok e Instagram. Sin embargo, la demostración del potencial de este modelo ya asombra a empresas y usuarios. Para aprender aún más sobre GPT-4, puede ver el video de demostración de la compañía que demuestra visualmente las capacidades:

Puede encontrar más información básica sobre GPT-4 aquí en el sitio web dedicado de OpenAI. La empresa escribe:

Esperamos que GPT-4 se convierta en una herramienta valiosa para mejorar la vida de las personas al potenciar muchas aplicaciones. Todavía queda mucho trabajo por hacer, y esperamos mejorar este modelo a través de los esfuerzos colectivos de la comunidad construyendo, explorando y contribuyendo al modelo.


IA abierta:

API para ChatGPT y Speech-to-Text para Whisper

Logotipo de OpenAI sobre fondo de OpenAI, © OpenAI vía Canva
© OpenAI a través de Canva

Source: OnlineMarketing.de by onlinemarketing.de.

*The article has been translated based on the content of OnlineMarketing.de by onlinemarketing.de. If there is any problem regarding the content, copyright, please leave a report below the article. We will try to process as quickly as possible to protect the rights of the author. Thank you very much!

*We just want readers to access information more quickly and easily with other multilingual content, instead of information only available in a certain language.

*We always respect the copyright of the content of the author and always include the original link of the source article.If the author disagrees, just leave the report below the article, the article will be edited or deleted at the request of the author. Thanks very much! Best regards!