Si fos IA, ho sabrIA?

Fabio Galiana Martínez

La Intel·ligència Artificial generativa és aquella capaç de crear nous continguts o idees a partir d’altres continguts o idees ja existents. La IA generativa d’imatges, concretament, millora tan ràpid que cada vegada costa més distingir entre les seves creacions i les fotografies reals.

Segons Mónica Ballesta, professora de l’àrea d’Enginyeria de Sistemes i Automàtica de la Universitat Miguel Hernández d’Elx (UMH), la generació d’imatges mitjançant IA està basada en models d’aprenentatge profund. Un exemple d’això són les xarxes generatives adversàries (XGAs), que es basen en dues xarxes que competeixen entre si. Una intenta «enganyar» l’altra mentre va aprenent en el procés. D’aquesta manera, aconsegueix generar imatges sintètiques amb un realisme tal que és difícil distingir-les de les imatges reals.

En general, aquest tipus de models treballa amb una gran quantitat d’imatges, de les quals aprèn patrons complexos com formes, textures, estils, etc. A major volum d’imatges amb les quals realitzar entrenaments, millors resultats es poden obtenir. D’altra banda, l’estructura interna d’aquestes xarxes està formada per diferents capes interconnectades per les quals va passant la informació amb la qual són alimentades.

Un factor determinant en el rendiment de les eines d’IA, afirma Ballesta, són els prompts (sol·licituds que fa l’usuari a la IA). Depenent de la precisió que tinguem a l’hora de fer una sol·licitud, la IA ens proporcionarà millors o pitjors resultats. No obstant això, hi ha més variables implicades en el procés. Aquelles imatges que són més demandades pels usuaris, com les de persones atractives, són més fidels a la realitat que les menys demandades. Això provoca una de les desavantatges de la IA: el biaix.

Imaginem-nos un pintor sense aspiracions artístiques que només pinta retrats per encàrrec. Els seus mecenes són totes persones adinerades, de bona salut i ben vestides. Per deformació professional, en el cas que l’artista vulgui pintar una altra cosa, el més probable és que tendeixi a replicar l’aspecte de les persones que ha pintat durant anys. Això és el que passa amb la IA: prefereix generar imatges que està acostumada a generar i de les quals disposa més exemples. Per tant, si les sol·licituds dels usuaris i els bancs d’imatges estan sesgats, les seves creacions també ho estaran.

Tot i que la IA ha fet grans avenços i s’utilitza en molts àmbits (publicitat, contingut multimèdia, etc.), és d’esperar que el nivell de realisme i detall sigui major en un futur no molt llunyà. A més, les imatges que genera tenen errors que podem identificar si ens fixem bé.

La IA generativa d’imatges i les persones

Les persones que crea la IA solen presentar malformacions a les extremitats, com més de cinc dits a cada mà, i pentinats impossibles que es barregen els uns amb els altres. D’una banda, les seves pells són massa perfectes, com si utilitzaren el ‘mode bellesa’ de la càmera del mòbil a màxima potència. D’altra banda, els seus ulls no tenen ànima ni mostren emocions. Pel que fa als animals, la seva aparença acostuma a ser massa ideal, com si en comptes d’animals reals fossin models dissenyats per assemblar-se a la imatge mental que tenim d’ells.

La IA generativa d’imatges i els objectes inanimats

A diferència del que passa amb les imatges de persones o animals creades amb IA, les que contenen paisatges o objectes inanimats presenten menys desperfectes i poden passar més desapercebudes. Un truc per detectar-les és prestar atenció a si la imatge inclou textos, ja que la IA no és una bona dissenyadora gràfica. Si està ben entrenada, pot arribar a formar textos molt simples i breus, però el més normal és que falli en el continent o el contingut: paraules inventades o amb faltes d’ortografia, lletres borroses, etc.

La IA generativa d’imatges i les il·lustracions científiques

Un altre exemple de limitacions d’imatges generades per la IA serien les il·lustracions científiques: pot ser que les imatges generades semblin correctes a ulls del públic general, però no siguin en absolut rigoroses sota una mirada científica. De fet, poden tenir errors importants, com dibuixos i textos sense cap sentit.

La IA generativa d’imatges i la geometria

La simetria i la geometria tampoc se li donen bé. És habitual que generi imatges amb perspectives impossibles o edificis amb arquitectures sense sentit, com columnes que no connecten amb el sòl. Les figures llunyanes, ja siguin de humans o animals, es distorsionen quan ampliem la imatge. En resum, com diu el refrany anglès, ‘el dimoni està en els detalls’.

Posa en pràctica els teus coneixements amb el següent joc, en el qual hauràs d’identificar quina de les imatges de cada parella és la veritable i quina la generada amb intel·ligència artificial.

También te podría interesar

LEAVE YOUR COMMENT

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *