A pesar de su nombre, OpenAI no produce modelos de IA de código abierto. Todos sus modelos, como GPT y DALL·E, son propietarios o de código cerrado. ¿Y qué hay de Llama de Meta? Aunque Mark Zuckerberg lo describe como «código abierto,» en realidad es más preciso llamarlo abierto, a diferencia de los modelos de OpenAI. Bienvenidos al confuso mundo de las definiciones modernas de IA.
En general, los modelos de IA se dividen en tres categorías principales:
- Propietarios
- De código abierto
- Abiertos
Estas clasificaciones aplican tanto a modelos de lenguaje grande (LLM) como a generadores de texto a imagen. Mientras todo sigue evolucionando, la Open Source Initiative (OSI) trabaja en una definición oficial de lo que significa que un modelo de IA sea de código abierto. Veamos cómo están las cosas hasta ahora.
¿Qué significa código abierto?
Antes de analizar los modelos de IA de código abierto, es importante entender qué implica realmente este término. No es solo una palabra de moda. La OSI mantiene una definición clara sobre la filosofía y los requisitos detrás del código abierto.
Para ser considerado código abierto:
- El código fuente debe estar disponible de forma gratuita para que cualquiera lo use, modifique y distribuya con cualquier propósito.
- Las licencias no pueden restringir «ámbitos de uso,» lo que descalifica a muchos modelos que se autodenominan abiertos.
Algunas licencias destacadas de código abierto son:
- Apache 2.0 License
- MIT License
- GNU General Public License
¿Qué son los modelos de IA propietarios?
Los modelos de IA propietarios dominan el panorama de la IA actual. Desarrollados y controlados por empresas privadas, estos modelos mantienen en secreto su código fuente, datos de entrenamiento y parámetros. El acceso está restringido a través de herramientas oficiales, como APIs o aplicaciones dedicadas.
Por ejemplo:
- GPT-4o de OpenAI: No se conoce su data de entrenamiento ni sus parámetros. Solo es accesible a través de servicios como ChatGPT o mediante su API, con costos desde $20/mes en ChatGPT Plus.
- Otros modelos propietarios incluyen:
- OpenAI: GPT-4o Mini, DALL·E 3
- Anthropic: Claude 3, Claude 3.5
- Google: Gemini, Imagen 3
- Cohere: Command R y R+
- MidJourney
¿Qué es la IA de código abierto?
Los modelos de IA de código abierto están disponibles bajo licencias de código abierto, pero no todos los que se denominan así cumplen con los requisitos. Esta práctica, conocida como «open-washing,» genera confusión en el sector.
Para que un modelo sea verdaderamente de código abierto, debe cumplir con los siguientes requisitos:
- Disponibilidad gratuita del código fuente, datos de entrenamiento, parámetros y documentación.
- Uso de licencias de código abierto (como Apache 2.0) y licencias abiertas para contenido (como Creative Commons).
Las licencias de código abierto son increíblemente permisivas. Aunque algunas exigen que los trabajos derivados también sean de código abierto, en general imponen pocas restricciones. Por ejemplo, alguien podría usar un modelo de IA de código abierto para construir un negocio multimillonario o incluso herramientas no éticas, como chatbots para delitos, sin infringir los términos de la licencia.
Puedes revisar el borrador de definición de IA abierta y la lista de requisitos en el sitio web de la OSI.
¿Qué son los modelos de IA abiertos?
Los modelos de IA abiertos están en un punto intermedio entre los modelos propietarios y los de código abierto. Generalmente son accesibles de manera gratuita bajo ciertas condiciones, como límites de uso o restricciones en aplicaciones específicas.
Por ejemplo:
- Llama 3 de Meta: Permite usos comerciales hasta 700 millones de usuarios mensuales, pero restringe ciertos usos.
- Gemma 2 de Google: Prohíbe usos como facilitar actividades delictivas o comportamientos poco éticos.
Aunque estas restricciones tienen sentido desde un punto de vista ético, van en contra de los principios del código abierto, lo que genera debates entre investigadores y desarrolladores.
Los mejores modelos de IA abiertos y de código abierto
Modelo | Desarrollador | Tipo | Licencia | Parámetros | Notas |
---|---|---|---|---|---|
Llama 3.1 | Meta | LLM | Personalizada | 8B, 70B, 405B | Uso restringido y límites de usuarios |
Gemma 2 | LLM | Personalizada | 2B, 9B, 27B | Prohibidos usos no éticos | |
Phi-3 | Microsoft | LLM | MIT | 3.8B, 7B, 14B | |
Mixtral 8x7B | Mistral | LLM | Apache 2.0 | 8x7B | Modelo Mixture of Experts |
OLMo 7B | Allen Institute for AI | LLM | Apache 2.0 | 7B | Modelo más abierto disponible |
Stable Diffusion | Stability AI | Generador | Personalizada | N/A | Versiones previas disponibles bajo licencias abiertas |
¿Deberías usar un modelo de IA abierto o de código abierto?
Aunque el número de modelos de IA verdaderamente de código abierto es limitado, los mejores modelos abiertos son altamente competitivos frente a las alternativas propietarias. Por ejemplo, Llama 3 405B y FLUX.1 ofrecen un rendimiento comparable al de GPT-4o y DALL·E 3, pero a una fracción del costo y con mayor flexibilidad.
Si tienes los conocimientos técnicos necesarios, los modelos abiertos son una excelente opción por su balance entre potencia y libertad.
Lecturas relacionadas:
- ¿Qué son los modelos de lenguaje pequeño?
- Las mejores alternativas a ChatGPT
- Los mejores modelos de lenguaje grande (LLM)
REF: (1)