Hur man använder DALL-E 2: Utforskning och möjligheter

DALL-E 2 är ett AI-system som skapats av OpenAI och som kan skapa realistiska bilder och ändringar från textbeskrivningar. Namnet ”DALL-E” kommer från kombinationen av ”Salvador Dali” och ”WALL-E” och syftar på konstnärens och robotkaraktärens surrealistiska och generativa kreativitet. Med DALL-E 2 kan du skapa konst och visualiseringar helt enkelt genom att använda textbeskrivningar, utan att du behöver ha konstnärlig talang. AI:n sköter bildgenereringen åt dig.

Med DALL-E 2 kan du generera helt originella bilder från textförfrågningar som du skriver. Du kan också redigera och manipulera befintliga bilder och foton på kreativa sätt. Med DALL-E 2 kan du generera stiliserad konst i historiska, konstnärliga och fantasifulla stilar. Det kan producera bilder för logotypdesign, produktmodeller, inredningsdesign, landskap, människor och mycket mer.

I huvudsak ger DALL-E 2 dig möjlighet att visualisera praktiskt taget vad som helst med AI-genererade bilder med hjälp av enkla beskrivningar av vad man vill skapa. Hur häftigt är inte det?

DALL-E 2: En resa genom dess utveckling och sammanhang

DALL-E 2 är efterföljaren till DALL-E, en AI-bildgenerator som tidigare lanserades 2021 av OpenAI. OpenAI-forskare har arbetat med DALL-E 2 sedan 2019. Projektet syftar till att utveckla en AI som assisterar – snarare än ersätter – mänsklig kreativitet. Trots sitt namn är DALL-E 2 inte riktigt intelligent i mänsklig bemärkelse. Den genererar helt enkelt bilder som statistiskt sett matchar det semantiska innehållet i de textuella ”uppmaningar” som användaren ger.

Att förstå hjärnan i DALL-E 2: AI:s inre arbete

AI-modellen bakom DALL-E 2 innehåller två huvudkomponenter: en textkodare som representerar din uppmaning som en högdimensionell vektor, och en bildavkodare som genererar bilder baserade på denna textvektor.

Textkodaren har tränats på hundratals miljoner mänskligt skrivna bildtexter för att lära sig hur man representerar en skriftlig beskrivning.

Bildavkodaren har tränats genom att jämföra sina kandidatbilder med de originalbilder som motsvarar en bildtext.

När du anger en uppmaning omvandlar DALL-E 2:s textkodare den till en vektor som bildavkodaren kan tolka för att ta fram tre bilder som motsvarar din beskrivning. AI:n använder diffusionsmönster, en teknik som gradvis omvandlar brus till realistiska bilder över tiden. Detta hjälper DALL-E 2 att producera fotorealistiska, högupplösta resultat.

Komma igång med DALL-E 2: Registrering och första skapelser

Registrera dig och skapa ett konto

Du måste först registrera dig för ett OpenAI-konto. Du måste ange grundläggande uppgifter som ditt namn, din e-postadress och skapa ett lösenord.

Här är länken för att registrera dig: https://openai.com/product/dall-e-2

DALL-E 2:s gränssnitt och huvudfunktioner

Gränssnittet för DALL-E 2 är tillgängligt via en webbläsare. De viktigaste funktionerna är :

  • En textfält där du skriver in din textbeskrivning.
  • Ett ”Upload”-alternativ för att ladda upp befintliga bilder som du vill ändra eller skapa variationer.
  • En ”Generera”-knapp för att skapa bilder utifrån din textförfrågan.
  • När bilderna har genererats visas fyra alternativ som skapats av AI. Du kan sedan välja ett för att spara eller generera nya varianter.
  • En funktion ”Redigera” som gör det möjligt att ändra de genererade bilderna genom att ta bort delar och skriva in en ny uppmaning.
  • Ett alternativ ”Variationer” för att skapa ytterligare genererade bilder utifrån samma uppmaning.
  • En ”Save to Collection”-knapp för att organisera dina bilder i samlingar för att lättare komma åt dem senare.

Generera dina första bilder

När du har ett konto och har tillgång till DALL-E 2 är det bara att

  • Skriv in en kort text (5-10 ord) som beskriver den bild du vill skapa. (Du får endast använda engelska i inmatningarna)
  • Klicka på knappen ”Generera”.
  • Vänta cirka 30 sekunder medan AI genererar 4 bilder utifrån din uppmaning.
  • Granska de 4 alternativen och välj det du föredrar.
  • Spara bilden till en samling om du vill

Börja med enkla, okomplicerade uppmaningar för att bekanta dig med systemet. Gör sedan gradvis dina uppmaningar mer komplexa och detaljerade allteftersom du får erfarenhet av DALL-E 2.

Här är ett exempel med uppmaningen ”en vit hund som springer på ett fält”

Vi ser resultatet, med uppmaningen högst upp och de fyra bilderna nedan.

Utveckla en effektiv uppmaning: Konsten att styra DALL-E 2

Anatomin hos en effektiv uppmaning

Den viktigaste faktorn som bestämmer kvaliteten på bilderna i DALL-E 2 är uppmaningen. Effektiva uppmaningar är :

  • Detaljerade: Innehåller många adjektiv, objekt, stilar, sammanhang och specifika egenskaper.
  • Fokuserade : De tar upp ett enda, kortfattat koncept eller en scen snarare än flera idéer.
  • Specifika : Nämn konkreta detaljer som ger AI bokstavliga ledtrådar att införliva i bilden.
  • Stiliserad : Inkludera konstnärliga stilar, medier och tidsperioder som genomsyrar bildgenereringen.
  • Experimentell : Omformulera, utvidga och ändra dina uppmaningar för att skapa nya variationer.
  • Lämpligt : Undvik partisk, skadligt eller olagligt innehåll som inte är förenligt med DALL-E 2:s användningsområden.
  • Användning av adjektiv, objekt, stilar och andra detaljer

För att generera bilder av hög kvalitet bör du sträva efter uppmaningar med :

  • 5+ adjektiv som beskriver viktiga egenskaper (t.ex. färg, form, känsla, sammanhang etc.)
  • 3+ utmärkande objekt som är centrala för scenen eller föreställningen
  • 1-2 konstnärliga stilar, medier eller tidsperioder för att förankra generationen
  • 2+ sammanhang, platser eller miljöer där scenen kan äga rum
  • Lämpliga verb och prepositioner för att länka samman de olika elementen

Försök att skapa din uppmaning genom att åberopa så många visuella detaljer som möjligt i din uppmaning. Ju mer nyanserad information du ger, desto bättre kommer den bild som skapas av DALL-E 2 att stämma överens med din vision.

Här är ett exempel på en komplex uppmaning för DALL-E 2:

”iphone gjord av terrakotta från Harappa, Indus Valley Civilization, Pakistan; 2600-1900 f.Kr., studioljus”

– Den anger ett centralt objekt – en iPhone
– Den nämner att iPhone är tillverkad av terrakotta för att ge ett ovanligt utseende
– Den placerar objektet i ett specifikt kulturellt och geografiskt sammanhang – Indus Valley Civilization i Harappa, Pakistan, cirka 2600-1900 f.Kr.
– Den förankrar generationen i en historisk stil och period – det antika Indus
– Den nämner belysningsförhållanden – studioljus – för att vägleda den visuella återgivningen

I denna uppmaning används flera av de nämnda teknikerna:

– Den ger 3+ distinkta objekt: en iPhone, terrakotta, studioljus
– Den förankrar generationen i en stil (”terrakotta”) och en historisk period (Indus)
– Den placerar scenen i ett specifikt sammanhang: Harappa, Indusdalen, 2600-1900 f.Kr.
– Den använder verb och prepositioner för att koppla samman elementen: ”iPhone made of…from Harappa”

Styrkorna i denna uppmaning är följande:

– Den höga graden av specificitet: plats, period och material är exakt definierade
– Den ovanliga men rimliga detaljen: en iPhone av terrakotta från bronsåldern
– Den övergripande samstämmigheten: alla element kombineras logiskt i den beskrivna scenen

Sammanfattningsvis bör denna välstrukturerade och detaljrika uppmaning ge en mycket specifik och intressant bild tack vare all den information som AI-modellen får. Det är ett bra exempel på hur en komplex uppmaning effektivt kan vägleda bildgenerering med DALL-E 2.

Denna typ av genomarbetad och nyanserad uppmaning är nödvändig för att producera fotorealistiska och mycket specifika bilder med DALL-E 2. Ju mer information du kan ge AI-modellen, desto större är sannolikheten att den exakt fångar och representerar den scen du har i åtanke.

Utmaning för komplex bildgenerering: Tips och teknik

För ambitiös bildgenerering som t.ex:

  • Komplexa scener med flera objekt
  • Modifierade eller kombinerade befintliga bilder
  • Fotorealistiska representationer av verkliga situationer

Prova tekniker som :

  • Attbryta ner din uppmaning till 2+ kortare, enklarebeskrivningar för att generera referensbilder
  • Redigera/kombinera de bästa referensgenerationerna med hjälp av DALL-E 2:s redigeringsverktyg
  • Förbättra din uppmaning successivt genom flera generationer och ändringar
  • Utkontraktera deluppgifter (t.ex. generering av enskilda objekt) och kombinera resultaten

Med komplexa prompter krävs ofta flera generationer och iterativa ändringar för att producera högkvalitativa bilder som helt och hållet förverkligar din vision. Ha tålamod, experimentera ofta och förfina dina instruktioner med tiden.

Generering av stiliserade bilder

Generering av konstnärliga renderingar

Om du vill generera konstnärliga renderingar kan du inkludera stilistiska nyckelord som t.ex:

  • Oljefärg, akvarell, kolskiss, digital konst, pixelkonst
  • Impressionistisk, surrealistisk, abstrakt expressionistisk, kubistisk osv.
  • Nämn en konstnärlig stil: ”i stil med Van Gogh”, ”Picasso-esque”, etc.
  • Prova flera stilar: ”En abstrakt akvarellmålning i surrealistisk stil”.
  • Variera komplexiteten: enkla → detaljerade scener fungerar bäst för varje stil.
  • Gör animationer: Lägg till ”GIF” eller ”animation”.
  • Experimentera till det yttersta! Blanda renässansstil med pixelkonst, anime med pointillism osv.
  • Framställning av historiska och tidstypiska bilder

Du kan ge indikationer på stilen i ”tiden”, till exempel:

  • Stenålder
  • Det gamla Egypten, Grekland, Rom
  • Medeltiden
  • Renässans
  • Viktoriansk tid
  • 1980-talet, 1990-talet

Du kan föreställa dig specifika händelser, platser eller föremål:

  • Anachronismer: ”En egyptisk fest med iPhones”.
  • Evenemang som nämns: ”Undertecknandet av självständighetsförklaringen”
  • Kulturellt lämpliga föremål, kläder, arkitektur.
  • Skapande av illustrerade bilder

Det är fullt möjligt att ange syftet med bilden:

  • Handledning
  • Diagram för hälsa och vetenskap
  • Kartor
  • Bokillustrationer
  • Clipart
  • infografik

Användning :

  • ”En illustrerad…”
  • ”Ett diagram som visar…”
  • ”Clipart av…”
  • ”Ett etikettdiagram av…”

Redigering och manipulering av bilder

Det finns två andra intressanta verktyg att använda i Dall-2, inpainting för att ändra en del av bilden och outpainting, som gör det möjligt att fortsätta och utvidga befintliga bilder på nya och intressanta sätt, samtidigt som innehållet och stilen förblir konsekventa.

Inpainting med DALL-E 2: Konsten att radera och fylla luckor

Inpainting använder DALL-E 2:s redigeringsverktyg för att :

  • Ta bort oönskade föremål/personer från foton
  • Radera paneler, affischer eller distraherande element
  • Radera skadade/kompletta delar av bilder

Du kan därför:

  1. lägg till en bild genom att klicka på ”Upload”
  2. Välja suddgummiverktyget
  3. Radera den oönskade delen
  4. Ange en uppmaning som beskriver vad du vill ha i stället
  5. Justera uppmaningen enligt resultatet

Några tips:

  • Radera långsamt för att förfina urvalet.
  • Ange en detaljerad och specifik uppmaning.
  • Skapa flera bilder och jämför/kombiner resultaten.

Outpainting med DALL-E 2: Utöka din kreativa horisont

  • Bilder
  • Konstverk
  • Grafik

Du :

  1. Ladda upp en bild
  2. Välj ”Lägg till generativ ram
  3. Välj var du vill förstora bilden
  4. Skriv in en uppmaning om vad du vill ha, här har jag skrivit ”Staden i bakgrunden”

Jag tycker att resultaten är riktigt bra med Outpainting, det är ett av de mest intressanta alternativen jämfört med konkurrenterna.

Kom ihåg att ange hur du vill förstora genom att beskriva :

  • Ytterligare sammanhang
  • Ytterligare detaljer
  • Fortsättningar av motiv/ämnen

Inspirerar till variationer: Från produktdesign till grafisk konst

  1. Ladda upp en bild
  2. Ta bort bakgrunden (valfritt)
  3. Ange en uppmaning som beskriver de önskade ändringarna
  4. Välj ”Generera variationer
  5. Granska nya versioner
  6. Välj/kombinerar de bästa variationerna

Du kan variera :

  • Vinklar
  • Stilar
  • Väderförhållanden
  • Karaktärer/ämnen

Andra tillämpningar och användningsområden

Produktdesign och grafisk design

DALL-E 2 kan användas för produktdesign och grafisk design, t.ex. för att skapa produktmodeller, förpackningsmodeller och designkoncept. Teknikerna omfattar uppladdning av produktbilder, borttagning av bakgrunder, ändring av befintliga konstruktioner och kombination av element från flera konstruktioner. Du kan generera koncept och varianter för att utforska olika möjligheter. Du kan till exempel generera produktmock-ups ”Produkt av en vattenflaska i glas med flip-top lock på ett träbord” eller logotypkoncept ”En 2d, symmetrisk, platt logotyp för ett blockkedjeföretag som är snygg och enkel. Den ska vara av svart nyans och ska vara subtil”

DALL-E 2 och konceptuell konst: Stimulans för idéutveckling

DALL-E 2 utmärker sig för att generera konceptkonst och ideera designmöjligheter. Du kan utveckla koncept för bokomslag, filmaffischer, karaktärsdesign, fordonsdesign och mycket mer. Bra tekniker innebär iterativ konceptutveckling, utläggning av deluppgifter som att generera enskilda karaktärer och att kombinera element från flera koncept för att uppmuntra till nyhet. Du kan till exempel generera ”design av fantasifulla stadsportar i stil med World of Warcraft” eller ”skisser på utomjordiska varelser för en science fiction-film”

DALL-E 2 för utbildning: Bilder och diagram för inlärning

DALL-E 2 kan producera pedagogiska bilder och diagram som är tydliga, enkla och väl märkta. Användningsområden är bland annat generering av matematiska ekvationer, vetenskapliga diagram, anatomiska illustrationer, historiska scener och tidslinjer. Goda tekniker innebär att fokusera på tydlighet och enkelhet, märka delar och komponenter, inkludera bildtexter för sammanhanget, generera multiplar för jämförelse och återkomma med frågor för att förbättra kvaliteten. Du kan till exempel skapa ”ett detaljerat anatomiskt diagram över den mänskliga handen med märkta ben och senor” eller ”en visuell tidslinje över den amerikanska revolutionen med steg för steg och med bildtexter”

Utveckla din konstnärliga talang med DALL-E 2

Var kan du få inspiration till dina DALL-E 2-skapelser?

Inspirationskällor för DALL-E 2 textförslag och projekt är bland annat följande:

  • Wikipediaartiklar om de ämnen som du vill skapa bilder för
  • Konsthistoriska böcker om olika epoker eller stilar
  • Inspirationssajter för design med produkter, grafik och visuellt material
  • Webbplatser med royaltyfria foton för att få idéer till fotografiska koncept
  • Bildsökmotorer för allmän visuell inspiration
  • Bläddra i subreddits som r/Art, r/DesignPorn, för att få stimulans
  • Webbplatser för sociala medier som Pinterest och Instagram eller Twitter

Nyckeln är att ständigt utsätta dig för nya idéer, stilar och visuell stimulans som du kan översätta till DALL-E 2-förlagor och generationer.

Effektiv brainstorming: Metoder för att generera förslag och projekt

Tekniker för att hitta nya DALL-E 2 textförslag och projekt är bland annat följande:

  • Brainstorming genom fri association – Skriv ner allt som faller dig in
  • Lista – Skriv ner ämnen, stilar, attribut och egenskaper
  • Mind-mapping – Ordna relaterade begrepp visuellt på en karta
  • Frågeställning – Fråga dig själv ”vem?”, ”vad?”, ”hur?
  • Kompositformuleringar – Kombinera flera idéer till en formulering
  • Undersökning av intressanta begrepp – Läs artiklar om de ämnen som du vill generera
  • Ta det steg för steg – dela upp stora projekt i enkla frågor som du kan generera enskilt och sedan kombinera dem

Oroa dig inte om dina första försök med DALL-E 2 verkar lite klumpiga eller banala. Som med alla nya kreativa verktyg tar det tid att vänja sig vid det och utveckla en intuition om det. Men med regelbunden övning kommer du att bli mer och mer bekväm med att komma på originella och kraftfulla idéer att utforska.

Inspiration kommer inte alltid spontant, oavsett hur briljant du är! Du måste ge din fantasi näring genom att utsätta dig för nya idékällor – läs böcker om oväntade ämnen, skanna ovanliga bilder, se på världen omkring dig med nya ögon. Och när du börjar leta efter idéer för DALL-E 2, prova olika tekniker för att stimulera din kreativitet, till exempel att göra listor med fria associationer, kombinera avlägsna begrepp eller modifiera befintliga uppmaningar.

Med tid och övning kommer det att bli mer och mer naturligt att utveckla kreativa uppmaningar och projekt med DALL-E 2. Men glöm aldrig att fortsätta att ge näring åt din fantasi och leka med själva den kreativa processen. Det är det bästa sättet att bli en inspirerad och effektiv DALL-E 2-användare!

Är DALL-E 2 gratis?

Tyvärr nej, inte riktigt, DALL-E 2 har en kreditbaserad prisstruktur. Ett förutbestämt antal krediter kommer att ges till nya användare för att skapa, ändra eller variera foton. Till skillnad från ändring och variation resulterar generering i fyra bilder för en kredit. Krediter kan läggas till i steg om 15 dollar eller så kan de laddas upp månadsvis med 15 dollar i den andra månaden och 50 dollar i den första.

KostnadKrediterAntal bilder
Första månadenGRATIS50200
Varje efterföljande månadGRATIS1560
Ytterligare kreditpaket15 $115460

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *