Contingut publicat al butlletí Switch número 10 al març de 2023.
© 2020 Clúster Audiovisual de Catalunya
Web desenvolupat per La Saladeta
Contingut publicat al butlletí Switch número 10 al març de 2023.
La imatge que encapçala aquest bloc s’ha generat amb Midjourney V5. S’ha acabat l’etapa en què només es podien generar imatges fantàstiques o recreacions més o menys afortunades de l’estil d’autors coneguts. L’hiperrealisme sintètic generat amb frases de text ja és aquí. La versió 5 de Midjourney fa un salt espectacular. Rostres detallats, il·luminació i transparències de nivell fotogràfic i mans ben resoltes, un dels reptes pendents de la IA generativa.
Seguir les novetats de la IA generativa és una bogeria. No paren de sortir eines noves o versions evolucionades de les anteriors.
S’obren pas les empreses que ofereixen personatges virtuals personalitzables que poden parlar en qualsevol idioma. Llegeixen un text amb veus de qualitat i una entonació correcta i ofereixen la possibilitat de triar el fons i insertar-hi text, gràfics, imatges i vídeos. En molt poca estona es poden editar presentacions curtes bastant decents. Val la pena donar un cop d’ull a Colossyan, D-ID i Synthesia.
A Synthesia l’envolta la polèmica després que diversos dels seus avatars els ha utilitzat una suposada cadena de notícies (Wolf News) per difondre informacions falses.
Una de les principals novetats del nou GPT4, el generador de textos més recent i potent llançat per la factoria OpenAI, és la multimodalitat.
Actors de doblatge llatinoamericans alerten que comencen a ser substituïts per veus generades per IA. Empreses especialitzades en doblatge automàtic multiidioma com la israeliana Deepdub, la britànica Papercub o l’ucraïnesa Respeecher hi estan entrant amb força.