Adobe Firefly: En komplett guide till Adobes AI-bildgenerator

I. Inledning

Vi presenterar Adobe Firefly, den nya AI-bildgeneratorn från Adobe

Adobe Firefly är en bildgenerator med artificiell intelligens som utvecklats av Adobe. Den är en del av Adobes utbud av generativa AI-modeller, som alla är avsedda för kreativa uttryck. Faktum är att Firefly använder artificiell intelligens för att producera imponerande bilder och texteffekter, allt baserat på de ”prompts” eller idéer som vi ger den.

Det är ett verktyg som är utformat för att göra det möjligt för designers att förverkliga sina idéer mer effektivt och utan några begränsningar.

Det konkurrerar med andra verktyg på marknaden som Midjourney, Dall-e från OpenAI och Stable diffusion.

Du kan komma åt Adobe Firefly på denna URL: https: //www.adobe.com/fr/sensei/generative-ai/firefly.html

Adobe Firefly

Du kan registrera dig gratis:

adobe firefly login page

Därefter valde jag ”Text till bild” för att få tillgång till Adobes AI-bildgenerator.

integrering i Adobes hela programutbud med tonvikt på den unika aspekten av dess kommersiella användning

Firefly är utformat för att integreras direkt i Adobes applikationssvit, inklusive Creative Cloud, Document Cloud, Experience Cloud och Adobe Express. Denna integration gör det möjligt för användare att utnyttja kraften i generativ AI i sina befintliga arbetsflöden, vilket ökar produktiviteten och det kreativa uttrycket för alla designers.

II. De olika lägena i Adobe Firefly

Adobe Firefly erbjuder flera olika lägen för att möta olika kreativa behov. Dessa lägen inkluderar Text to Image, Generative Fill, Text Effects, Generative Recolor, 3D to Image och Extend Image.

Text till bild-läge

I detta läge kan användare generera bilder från textbeskrivningar. Jämfört med andra AI-verktyg för bildgenerering utmärker sig Adobe Firefly genom sin förmåga att generera högkvalitativa, kommersiellt gångbara bilder.

Firefly är bättre på att skapa realistiska scener än imaginära, sagolika eller science fiction-scener.

Detta beror främst på att Adobe Fireflys träningsdataset huvudsakligen består av dess Stock Images-bibliotek.

Testa svåra ”text till bild”-uppmaningar för generativ AI:

Vi kommer först att testa flera uppmaningar, inklusive de svårigheter som är kända för bildgenererande AI, för att testa verktygets genereringsfunktioner.

Allt du behöver göra är att klicka på ”Text till bild” och sedan skriva din uppmaning i det avsedda utrymmet.

Observera att texten måste vara på engelska:

Prompt test 1”en leende japansk man med ett glas whisky i sin högra hand och hälsar med sin vänstra hand” Denna prompt låter dig se om Adobe Firefly hanterar :

  • Höger från vänster
  • Respekt för alla förfrågningar i prompten
  • Antalet fingrar på en hand (detta är en av de största utmaningarna för bildgenererande AI)
  • Antalet tänder i en mun (detta är en annan stor utmaning även för Dall-e och Midjourney)
  • Innehåller bilderna inkonsekvenser som gör att de direkt kan identifieras som AI-genererade bilder.
Limitations adobe firefly

Resultat:

  • Höger från vänster: 3 av 4 bilder är OK i detta avseende (15/20)
  • Respekt för alla förfrågningar i prompten: Den första och tredje bilden respekterar instruktionerna perfekt, i den andra bilden säger karaktären inte hej med handen, och i den fjärde är glaset i fel hand. Det är normalt en 10/20 men det är värt att notera att vi fortfarande har 2 bilder som exakt motsvarar vår begäran, vilket är mer än tillräckligt för att hitta det du letar efter. Notera också att alla bilder respekterar karaktärens japanska ursprung samt Scotch's glas. Jag ger den 14/20
  • Antalet fingrar på en hand (detta är en av de största utmaningarna för bildgenererande AI:er): Vid första anblicken ser det ok ut, men i själva verket har bild 1 6 fingrar på vänster hand och en slags blandning på höger hand. Bild 2 verkar ha 4 fingrar. Bild 3 verkar ha en fusion med ett sjätte finger. Bild 4 har rätt antal fingrar. Med bara en bild (som inte helt respekterar den grundläggande uppmaningen) som har rätt antal fingrar och därför kan användas, är det en 08/20 för mig.
  • Antalet tänder i en mun (en annan stor utmaning även för Dall-e och Midjourney). En enda karaktär ler med alla sina tänder, och resultatet är OK, men om du tittar på detaljerna ser du att antalet och storleken på tänderna inte är riktigt naturliga, utan osynliga utan att zooma in. Ingen anmärkning eftersom det bara är en bild av 4.
  • Innehåller bilderna inkonsekvenser som gör att de direkt kan identifieras som AI-genererade bilder? Förutom händerna har vi ganska betydande deformationer på bilderna 1 och 3 (synd eftersom de är de mest trogna vår begäran). Annars är utseendet och ögonen verkligen OK. 11/20

Min åsikt om resultatet av denna Prompt: Om ett foto taget av en ”normal” människa är en 20/20 i 100% av fallen på realismaspekten, får vi här en 12/20. Å andra sidan utfördes detta test som ett ”one shot”, så jag är säker på att det är möjligt att omarbeta prompten och testa flera exempel, ibland ger bara regenerering av prompten bättre resultat.

Det här testet utfördes i juni 2023, och de framsteg som generativ AI har gjort de senaste månaderna, särskilt när det gäller ansikten, är helt otroliga. Det är möjligt att jag kommer att göra det här testet igen om 2 eller 3 månader och jag kommer lätt att få 15 eller 16.

Prompt 2 test”En bensinstation med en skylt som säger ”Nick's Gas Station””Denna prompt låter dig se hur bra Adobe Firefly hanterar handskrift, vilket också är en av de kända svårigheterna för de viktigaste spelarna som Dall-e, Midjourney och Stable Diffusion.

Prompt exemple Adobe Firefly

Resultat:

Inte en enda bild här lyckas återge texten i skyltarna, och vi kan också se att de andra texterna inte heller är begripliga. Bokstäverna är dock mycket väl integrerade, så det är en 08/20 för tillfället.

Så det var de största svagheterna i modellen för tillfället, vi ska nu titta på några intressanta exempel på konst som kan skapas med Adobe Firefly.

Exempel på användning av Adobe Firefly

En scen från livet: ”Peruansk kvinna, fångad i sin traditionella klädsel full av livfulla färger och intrikata mönster, arbetar flitigt på sin vävstol mot bakgrund av det rustika adobehuset med alpackor som betar på den solbelysta gården, utstrålar en känsla av lugn, hårt arbete och harmoni med naturen, i stil med Street Photography, tagen med en Nikon D850, använder ett 35 mm objektiv med en bländare på f/1,8, ISO 400, för att fånga livligheten och de fina detaljerna i scenen.”

Vi kan se att det finns många fler element i denna uppmaning, för att få en bild som är nära det vi vill ha är det viktigt att vara exakt.

Här skapas prompten på detta sätt:

[1] ”Peruansk dam”: Detta är huvudämnet för prompten.

[2] ”fångad i sin traditionella klädsel full av livfulla färger och intrikata mönster, arbetar flitigt på sin vävstol”: Här har jag gett en detaljerad beskrivning av den peruanska damen, beskrivit hennes kläder och vad hon gör.

[3] ”mot bakgrund av det rustika adobehuset med alpackor som betar på den solbelysta gården”: Jag beskrev sedan miljön i scenen, som utspelar sig på gården till ett rustikt hus med alpackor som betar på den solbelysta gården.

[4] ”utstrålar en känsla av lugn, hårt arbete och harmoni med naturen”: Den här delen beskriver stämningen i scenen. Jag valde att skildra en känsla av lugn, hårt arbete och harmoni med naturen.

[5] ”i stil med gatufotografi”: Jag valde stilen gatufotografi för den här bilden, eftersom den matchar beskrivningen av scenen.

[6] ”tagen med en Nikon D850, med ett 35 mm objektiv med en bländare på f/1,8, ISO 400, för att fånga livfullheten och de fina detaljerna i scenen”: Slutligen gav jag detaljer om hur bilden skulle tas, med angivande av kamera, objektiv och lämpliga inställningar.

En fusion mellan ett lejon och en häst: ”Sammanslagning av häst och lejon, med en hästs starka bakdel och ett lejons hårda, guldmanade huvud, som tävlar över en strand med det turbulenta havet i bakgrunden, i en scen fylld av dynamisk energi och spänning, i form av ett realistiskt fotografi, taget med en Nikon D850 DSLR i serieläge för att fånga varelsens rörelse, med en stor bländare för ett grunt skärpedjup, fokuserar på motivet mot den suddiga bakgrunden.”

En futuristisk stad : ”Futuristic City, ett avancerat stadslandskap i skymningen, där kolossala byggnader som lyser med neonljus sträcker sig mot himlen och gatorna vimlar av autonoma fordon. Mitt bland betong- och metalljättarna erbjuder en park fylld med lysande flora en andningspaus, med grönskande träd som bär strålande frukter och glödande blommor. Denna morgondagens stad står under en skymningshimmel målad med nyanser av lila och orange, i en atmosfär som sjuder av den tekniska utvecklingens symfoni och en känsla av sofistikerat lugn. Bilden är tagen från en hög utsiktspunkt under den ”blå timmen”, med lämpliga inställningar för bländare, ISO och slutartid för att balansera de svaga ljusförhållandena och de livfulla stadsljusen.”

Hus mitt i skogen : ”Hus mitt i skogen och en stor flod tvärs över huset, en gammal timmerstuga med mossigt tak och rök från skorstenen omgiven av höga gamla träd, mot bakgrunden av en klar, bred flod som reflekterar det fläckiga solljuset, bilden inger en känsla av ensamhet och lugn med det lugnande ljudet av rinnande vatten och prasslande löv, och är tagen i stilen Photography, Landscape photography med en Canon EOS 5D Mark IV som använder ett vidvinkelobjektiv för ett bredare perspektiv och en mindre bländare för att hålla både huset och skogen i fokus.”

En arkivbild av en läkare och en patient: ”Doktor och patient, en noggrant komponerad scen med en läkare i vit rock med ett stetoskop runt halsen som pratar med en patient som sitter mitt emot honom i en väl upplyst, modern vårdklinik, i en atmosfär av förtroende, empati och hopp, tagen i fotografi med en Canon EOS 5D Mark IV i porträttläge, med ISO 100, bländare f/1,8, slutartid 1/200 för att fånga högkvalitativa, skarpa och detaljerade ansiktsuttryck och en bokeh-bakgrund.”

Andra Adobe Firefly-lägen:

  1. Generative Fill: Med detta läge kan användarna ändra element direkt i en bild, t.ex. ändra bakgrunden, lägga till element i en modell, ändra en färg… Kort sagt, möjligheterna är nästan oändliga. Vi kommer att titta närmare på detta i en senare artikel.
  2. Texteffekter: I detta läge kan användare skapa text med en generativ fyllning enligt en uppmaning, det är ganska enkelt men svårt att beskriva. Det här är vad jag använder för den utvalda bilden i den här artikeln
  3. Generative Recolor: I det här läget kan du ändra färgerna på vektorbilder. Det är ett snabbt sätt att testa flera varianter av en vektorbild.
  4. 3D to Image: I det här läget omvandlas 3D-element som du placerar enligt önskat perspektiv till en 2D-bild, vilket ger ett unikt perspektiv och kreativa möjligheter. Verktyget är ännu inte tillgängligt i skrivande stund.
  5. Förläng bild: I detta läge kan du ”förlänga” en bild, dvs. skapa en fortsättning av en bild på sidorna ovanför den. Detta läge är ännu inte tillgängligt i onlineansökan.

IV. Några exempel på hur verktyget kan användas

När det gäller grafik kommer designproffs utan tvekan att vara de första att använda Adobe Firefly. Avsnittet ”Generative Fill” , till exempel, kan spara otroligt mycket tid när man testar flera varianter av en design, särskilt som Firefly nu är integrerat direkt i Photoshop. Du sparar tid, ökar produktiviteten och upptäcker designidéer som du inte skulle ha kunnat tänka ut för hand.

Inom reklam och marknadsföring kan designers och marknadsförare använda verktyg som Adobe Firefly för att skapa skräddarsydd reklam och innehåll för sina målgrupper. Stockbilder kan skapas efter mått. Dessa bilder kan anpassas relativt enkelt, och A/B-tester kan utföras med 10 eller 20 olika bilder baserat på användardata för att maximera engagemanget och konverteringsgraden. Inte illa, eller hur?

När det gällerutveckling av webbplatser kan utvecklare använda AI för att generera bilder och grafik för webbdesign. Detta bidrar till att minska kostnader och tidsåtgång för att söka efter eller skapa bilder.

När det gäller attskapa innehåll för sociala nätverk kan AI användas för att skapa visuellt tilltalande och engagerande innehåll för sociala nätverksplattformar, inklusive infografik, memes och andra delningsbara bilder.

Inom tryck och publicering kan AI användas för att skapa bilder för tryckta medier, som tidskrifter, tidningar och böcker. Detta kan mycket väl förändra förutsättningarna för att skapa visuellt innehåll för dessa branscher.

Inom spel och underhållning kan spelutvecklare och filmskapare använda AI för att skapa bilder och grafik för sina produktioner. Detta kan resultera i mer realistisk grafik och mer uppslukande upplevelser för tittarna.

Inom mode- och kläddesign kan AI användas för att skapa digitala modeller av kläddesign. På så sätt kan designers visualisera sina kreationer innan de produceras, vilket sparar tid och resurser.

När detgäller utbildningsmaterial kan lärare och utbildare använda AI för att skapa personliga bilder för att illustrera sina poänger. Detta kan bidra till att öka engagemanget och bibehållandet av information bland studenter eller praktikanter.

V. Slutsats

Här är min lilla analys av Adobe Firefly: Det är en fantastisk AI-driven bildgenerator, en riktig nyhet från Adobe. Den låter dig skapa högkvalitativa bilder och producera hisnande texteffekter tack vare AI. Det coola är att den är integrerad direkt i hela sviten av Adobe-applikationer, så för kreatörer är det en stor fördel att använda alla dess högteknologiska funktioner utan att lämna sin vanliga arbetsrutin.

Firefly har flera lägen på menyn: Text to Image, Generative Fill, Text Effect, Generative Recolor, 3D to image och Extend Image, för att tillgodose alla typer av kreativa behov. Varje läge har sina egna specifika funktioner, så att användarna kan skapa skräddarsydda bilder, utforska nya idéer och till och med automatisera vissa uppgifter.

Firefly är visserligen inte perfekt ännu. Till exempel kämpar den fortfarande lite med handstilsprecisionen och att följa instruktionerna i anvisningarna till punkt och pricka. Men ärligt talat gör den redan ett fantastiskt jobb med att skapa superrealistiska, kommersiellt användbara bilder. Och låt oss inte glömma att AI utvecklas i en rasande fart. Så framsteg inom detta område kommer säkert att öka Fireflys färdigheter ytterligare.

När man ser vad Adobe Firefly kan göra inser man att den har en enorm potential inom en mängd områden: grafik, reklam, webbutveckling, innehållsskapande för sociala nätverk, tryck och publicering, spel, underhållning, mode, kläddesign, utbildning, träning, etc.

Adobe Firefly erbjuder kort sagt en mängd kreativa möjligheter tack vare AI. Den förenklar bildskapandeprocessen och öppnar upp nya vägar för kreatörer, marknadsförare, utvecklare och andra yrkesverksamma. Med framtida förbättringar och integration med befintliga Adobe-applikationer har Firefly potential att bli en nyckelspelare i framtidens visuella skapande.

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *