Kakao améliore son jeu en IA générative avec Karlo 2.0, un générateur d’images d’IA

Le géant sud-coréen de la technologie Kakao veut une part de l’action dans la course à l’IA générative, et aujourd’hui, il a fait une offre pour cela, avec de grandes mises à jour de son générateur d’images AI Karlo et de son grand modèle de langage KoGPT, ainsi qu’un nouveau fonds pour soutenir Des startups génératrices d’images d’IA.

La division AI de Kakao, Kakao Brain, a lancé Karlo 2.0 – un outil alimenté par l’IA qui peut produire des images à partir d’invites textuelles – permet aux utilisateurs de générer une image en quelques secondes en saisissant des invites en anglais ou en coréen.

KoGPT 2.0, quant à lui, ne devrait pas être publié avant le troisième trimestre 2023, mais il sera formé sur 30 milliards de paramètres différents.

Kakao Brain aussi a mis en place Karlo 100X, un fonds de 10 milliards de wons (7,7 millions de dollars), pour soutenir les startups d’IA qui développent la technologie de génération d’images.

Les publications de Kakao soulignent la pression à laquelle l’entreprise, comme tous les acteurs technologiques en place, a été confrontée pour suivre le rythme des progrès de l’IA : des nouveaux venus comme OpenAI, Midjourney et bien d’autres ont fait sensation et contrôlé le récit des plus grandes innovations de le moment. Pour les entreprises plus anciennes, la menace n’est pas seulement qu’elles ne capitaliseront pas sur ce qui s’en vient, mais qu’elles commenceront à avoir l’air vieilles et obsolètes.

Il est révélateur que Karlo 2.0 arrive sept mois seulement après la mise à jour précédente de la société (1.4). Kakao Brain a précédemment publié un générateur de texte en image avancé RQ-Transformer et minDALL-E sur GitHub.

La société affirme que Karlo 2.0 est formé sur 300 millions de textes et d’images et prend en charge une résolution maximale de 2048 × 2048, ce qui améliore la qualité et la clarté des images dans différents styles et tailles. Il s’agit d’une grande avancée par rapport aux éditions précédentes de Karlo : la version précédente était entraînée sur 180 millions de points de données de texte et d’image.

Karlo 2.0 sera également plus convivial pour les développeurs, avec une API accessible au public pour les développeurs de Kakao qui leur donne accès à la création gratuite de 600 000 images par mois.

Son prédécesseur, également appelé KoGPT, a été initialement déployé en 2021 et formé sur 200 milliards de jetons sur seulement 6 milliards de paramètres, utilisant des données coréennes. Le plan est maintenant d’ajouter l’anglais, le japonais et d’autres langues asiatiques, y compris le bahasa malais et le vietnamien. Kakao Brain devrait lancer KoGPT 2.0 avec 30 milliards de paramètres, ciblant le troisième trimestre de 2023.

Crédits image : Cerveau de Kakao

Les mouvements de Kakao sont intéressants, mais ils ne viennent pas dans le vide et feront face à beaucoup de concurrence établie. Des générateurs d’images sont déjà disponibles auprès d’OpenAI (sous la forme de DALL-E)Mi-parcours et Diffusion stable‘s Dream Studio. Pas plus tard que la semaine dernière, le géant chinois de la technologie Alibaba a dévoilé un modèle génératif de synthèse texte-image alimenté par l’IA Tongyi Wanxiang pour les entreprises clientes.

Comme pour l’application de messagerie KakaoTalk, leader régional de l’entreprise, l’ouverture d’une entreprise comme Kakao semble être un acteur de premier plan dans les images d’IA sur son marché, plutôt que de viser la domination mondiale. Plus tôt cette année, Eun-Taek Hong, PDG de Kakao, a déclaré dans son appel aux résultats que la société de technologie coréenne offrirait des services d’IA générative. Mais plutôt que de rivaliser avec des pairs mondiaux dans le domaine, Kakao développerait des offres d’IA en mettant l’accent sur la langue coréenne (pour l’instant), a déclaré Hong.

Il sera également intéressant de voir comment et si Kakao construit cela en tandem avec ses autres ambitions en matière d’IA. Par exemple, il fait une incursion dans l’industrie de la santé. La société développe une offre générative d’IA pour analyser une image médicale et rédiger une première ébauche de diagnostic de la radiographie pulmonaire d’un patient pour les médecins. Il développe également une technologie d’IA pour la découverte de médicaments.

« Nous sommes heureux de présenter Karlo 2.0 à travers un processus d’apprentissage de diverses données d’image et d’avancées technologiques, y compris les proportions et la composition humaines, et des vues en perspective qui expriment une sensation d’espace et de tridimensionnalité », a déclaré le PDG de Kakao Brain Kim Ildoo dans un déclaration. « Nous utiliserons une multitude de données et de commentaires des utilisateurs pour créer des images photoréalistes tout en développant un modèle de génération d’images capable de répondre à un plus large éventail de besoins des utilisateurs. »

Même au niveau régional, il y a beaucoup de concurrence pour Kakao, d’autres sociétés sud-coréennes développant de manière agressive leurs propres produits d’IA pour se bousculer pour une position dans l’espace de l’IA générative.

Naver est sur le point de lancer un service d’IA génératif appelé HyperCLOVA X et un chatbot d’IA SearchGPT le mois prochain.

En décembre 2021, Recherche LG sur l’IA, une unité de groupe de réflexion sur l’IA de la société technologique coréenne LG, a dévoilé son grand modèle de langage alimenté par l’IA appelé Exaone avec des capacités de 300 milliards de paramètres. La plupart des filiales de LG, dont LG Electronics, LG Energy Solution, LG U+ et LG Display, utilisent Exaone. LG Electronics a lancé son propre chatbot IA en mai à la suite de bloquer l’utilisation d’outils d’IA générative comme ChatGPT, Google Bard et Bing AI de Microsoft.

Et Samsung serait en train de développer un outil privé d’IA générative à usage interne uniquement après restreindre les outils d’IA générative après une fuite de données sensibles.

SK Telecom, l’une des plus grandes sociétés de télécommunications de Corée du Sud, a également a ajouté la technologie Chat GPT basée sur Azure OpenAI de Microsoft à son chatbot AI appelé un. [A dot]. Deux des plus grandes sociétés de télécommunications coréennes, KT et U+ de LG, développent des chatbots IA basés sur la technologie ChatGPT, selon les médias locaux.

Cette histoire a été mise à jour pour refléter que KoGPT 2.0 ne sera pas basé sur ChatGPT-3.5.

Source-146