Adobe Firefly: Kompletny przewodnik po generatorze obrazów AI firmy Adobe

I. Wprowadzenie

Przedstawiamy Adobe Firefly, nowy generator obrazów AI od Adobe

Adobe Firefly to generator obrazów sztucznej inteligencji zaprojektowany przez firmę Adobe. Jest on częścią gamy generatywnych modeli AI firmy Adobe, z których wszystkie są przeznaczone do kreatywnej ekspresji. W rzeczywistości Firefly wykorzystuje sztuczną inteligencję do tworzenia imponujących obrazów i efektów tekstowych, a wszystko to w oparciu o „podpowiedzi” lub pomysły, które mu dajemy.

Jest to narzędzie zaprojektowane w celu umożliwienia projektantom realizacji ich pomysłów w sposób bardziej wydajny i bez żadnych ograniczeń.

Konkuruje z innymi narzędziami na rynku, takimi jak Midjourney, Dall-e od OpenAI i Stable diffusion.

Dostęp do Adobe Firefly można uzyskać pod tym adresem URL: https: //www.adobe.com/fr/sensei/generative-ai/firefly.html

Adobe Firefly

Możesz zarejestrować się za darmo:

adobe firefly login page

Następnie wybrałem opcję „Text to Image”, aby uzyskać dostęp do generatora obrazów AI firmy Adobe.

integracja z pełnym pakietem aplikacji Adobe z naciskiem na unikalny aspekt jego komercyjnego wykorzystania

Firefly został zaprojektowany do bezpośredniej integracji z pakietem aplikacji Adobe, w tym Creative Cloud, Document Cloud, Experience Cloud i Adobe Express. Integracja ta pozwala użytkownikom wykorzystać moc generatywnej sztucznej inteligencji w istniejących przepływach pracy, zwiększając produktywność i kreatywną ekspresję wszystkich projektantów.

II. Różne tryby Adobe Firefly

Adobe Firefly oferuje kilka trybów spełniających różne potrzeby twórcze. Tryby te obejmują Text to Image, Generative Fill, Text Effects, Generative Recolor, 3D to Image i Extend Image.

Tryb Text to Image

Tryb ten umożliwia użytkownikom generowanie obrazów na podstawie opisów tekstowych. W porównaniu z innymi narzędziami do generowania obrazów AI, Adobe Firefly wyróżnia się możliwością generowania wysokiej jakości, komercyjnie opłacalnych obrazów.

Firefly lepiej radzi sobie z tworzeniem realistycznych scen niż wyimaginowanych, bajkowych czy science fiction.

Wynika to głównie z faktu, że treningowy zbiór danych Adobe Firefly składa się głównie z biblioteki Stock Images.

Testowanie trudnych podpowiedzi „tekst na obraz” dla generatywnej sztucznej inteligencji:

Najpierw wypróbujemy kilka podpowiedzi, w tym trudności znane sztucznym inteligencjom generującym obrazy, aby przetestować możliwości generowania narzędzia.

Wszystko, co musisz zrobić, to kliknąć „Text to image”, a następnie wpisać podpowiedź w przeznaczonym do tego miejscu.

Podpowiedź musi być tylko w języku angielskim:

Prompt test 1„a smiling japanese man with a glass of scotch in his right hand and greeting with his left hand” Ta podpowiedź pozwala sprawdzić, czy Adobe Firefly radzi sobie z :

  • Od prawej do lewej
  • Respektowanie wszystkich żądań w podpowiedzi
  • Liczba palców na dłoni (jest to jedno z największych wyzwań dla sztucznej inteligencji generującej obrazy)
  • Liczba zębów w jamie ustnej (to kolejne duże wyzwanie nawet dla Dall-e i Midjourney)
  • Czy obrazy zawierają niespójności, które sprawiają, że można je bezpośrednio zidentyfikować jako obrazy wygenerowane przez sztuczną inteligencję.
Limitations adobe firefly

Wynik:

  • Od prawej do lewej: 3 na 4 obrazki są w porządku pod tym względem (15/20)
  • Respektowanie wszystkich próśb zawartych w podpowiedzi: Pierwszy i trzeci obrazek są idealnie zgodne z instrukcjami, na drugim obrazku postać nie wita się ręką, a na czwartym szklanka jest w złej ręce. Zwykle jest to 10/20, ale warto zauważyć, że nadal mamy 2 obrazy, które dokładnie odpowiadają naszemu żądaniu, co jest więcej niż wystarczające, aby znaleźć to, czego szukasz. Należy również zauważyć, że wszystkie obrazy szanują japońskie pochodzenie postaci, a także szkockie szkło. Daję mu 14/20
  • Liczba palców na jednej dłoni (to jedno z największych wyzwań dla sztucznej inteligencji generującej obrazy): Na pierwszy rzut oka wygląda ok, ale w rzeczywistości obrazek 1 ma 6 palców na lewej dłoni i swego rodzaju mieszankę na prawej. Obraz 2 wydaje się mieć 4 palce. Obraz 3 wydaje się mieć fuzję z szóstym palcem. Obraz 4 ma prawidłową liczbę palców. Z tylko jednym obrazem (który nie jest idealnie zgodny z podstawową podpowiedzią), który ma odpowiednią liczbę palców i dlatego może być użyty, jest to dla mnie 08/20.
  • Liczba zębów w ustach (kolejne duże wyzwanie nawet dla Dall-e i Midjourney). Pojedyncza postać uśmiecha się wszystkimi zębami i rezultat jest w porządku, ale jeśli przyjrzysz się szczegółom, zobaczysz, że liczba i rozmiar zębów nie są tak naprawdę naturalne, ale niewidoczne bez powiększania. Brak notatki, ponieważ tylko jedno zdjęcie z 4.
  • Czy obrazy zawierają niespójności, które sprawiają, że można je bezpośrednio zidentyfikować jako obrazy wygenerowane przez sztuczną inteligencję? Oprócz rąk, mamy dość znaczące deformacje na obrazach 1 i 3 (szkoda, ponieważ są one najbardziej wierne naszej prośbie). Poza tym wygląd i oczy są naprawdę w porządku. 11/20

Moja opinia na temat wyniku tego Promptu: Jeśli zdjęcie zrobione przez „normalnego” człowieka to 20/20 w 100% przypadków w aspekcie realizmu, tutaj otrzymujemy 12/20. Z drugiej strony, ten test został przeprowadzony jako „jedno ujęcie”, więc jestem pewien, że można przerobić podpowiedź i przetestować kilka przykładów, czasami po prostu regeneracja podpowiedzi daje lepsze wyniki.

Ten test został przeprowadzony w czerwcu 2023 roku, a postępy poczynione przez generatywną sztuczną inteligencję w ostatnich miesiącach, szczególnie w przypadku twarzy, są dość niesamowite. Możliwe, że powtórzę ten test za 2 lub 3 miesiące i z łatwością uzyskam 15 lub 16.

Prompt 2 test„Stacja benzynowa z napisem „Nick's Gas Station””Ta podpowiedź pozwala zobaczyć, jak dobrze Adobe Firefly radzi sobie z pismem odręcznym, co jest również jedną ze znanych trudności głównych graczy, takich jak Dall-e, Midjourney i Stable Diffusion.

Prompt exemple Adobe Firefly

Wynik:

Tutaj ani jeden obraz nie jest w stanie odtworzyć tekstu w znakach, a także widzimy, że inne teksty również nie są zrozumiałe. Jednak napisy są bardzo dobrze zintegrowane, więc na razie damy mu 08/20.

To tyle, jeśli chodzi o główne słabości modelu w tej chwili, teraz przyjrzymy się kilku interesującym przykładom sztuki, które można stworzyć za pomocą Adobe Firefly.

Przykłady użycia Adobe Firefly

Scena z życia: „Peruwiańska kobieta, uchwycona w swoim tradycyjnym stroju pełnym żywych kolorów i skomplikowanych wzorów, pracująca pilnie na krośnie na tle rustykalnego domu z cegły, z alpakami pasącymi się na oświetlonym słońcem podwórku, promieniująca poczuciem spokoju, ciężkiej pracy i harmonii z naturą, w stylu fotografii ulicznej, wykonanej aparatem Nikon D850, przy użyciu obiektywu 35 mm z przysłoną f/1.8, ISO 400, aby uchwycić żywość i drobne szczegóły sceny”

Widzimy, że w tej podpowiedzi jest znacznie więcej elementów, aby uzyskać obraz zbliżony do tego, czego chcemy, ważne jest, aby być precyzyjnym.

Tutaj podpowiedź jest tworzona w ten sposób:

[1] „Peruwiańska dama”: To jest główny temat podpowiedzi.

[2] „uchwycona w swoim tradycyjnym stroju pełnym żywych kolorów i skomplikowanych wzorów, pilnie pracująca na krośnie”: Tutaj podałem szczegółowy opis peruwiańskiej damy, opisując jej ubrania i to, co robi.

[3] „na tle rustykalnego domu z cegły adobe z alpakami pasącymi się na oświetlonym słońcem podwórku”: Następnie opisałem scenerię sceny, na tle rustykalnego domu z cegły adobe z alpakami pasącymi się na oświetlonym słoń cem podwórku.

[4] „emanuje poczuciem spokoju, ciężkiej pracy i harmonii z naturą”: Ta część opisuje nastrój sceny. Zdecydowałem się przedstawić poczucie spokoju, ciężkiej pracy i harmonii z naturą.

[5] „w stylu fotografii ulicznej”: wybrałem styl fotografii ulicznej dla tego zdjęcia, ponieważ pasuje on do opisu sceny.

[6] „zrobione aparatem Nikon D850, przy użyciu obiektywu 35 mm z przysłoną f/1.8, ISO 400, aby uchwycić żywość i drobne szczegóły sceny”: Na koniec podałem szczegóły dotyczące sposobu wykonania zdjęcia, określając aparat, obiektyw i odpowiednie ustawienia.

Połączenie lwa i konia: „Połączenie konia i lwa, z silnym zadem konia i zaciekłą, złotą głową lwa, ścigającego się po plaży z burzliwym morzem w tle, w scenie pełnej dynamicznej energii i emocji, w formie realistycznego zdjęcia, wykonanego lustrzanką cyfrową Nikon D850 w trybie seryjnym, aby uchwycić ruch stworzenia, z szeroką przysłoną dla płytkiej głębi ostrości, skupiając się na obiekcie na rozmytym tle”

Futurystyczne miasto : „Futurystyczne miasto, zaawansowany krajobraz miejski o zmierzchu, gdzie kolosalne budynki świecące neonami rozciągają się do nieba, a ulice roją się od autonomicznych pojazdów. Pośród betonowych i metalowych gigantów, park wypełniony świetlistą roślinnością oferuje wytchnienie, z zielonymi drzewami rodzącymi promienne owoce i świecące kwiaty. To miasto jutra stoi pod niebem o zmierzchu pomalowanym odcieniami fioletu i pomarańczy, w atmosferze szumiącej symfonią postępu technologicznego i poczuciem wyrafinowanego spokoju. Uchwycone w stylu fotograficznym, przez obiektyw typu rybie oko, aby wyolbrzymić perspektywę i wzmocnić wspaniałość krajobrazu miasta, zrobione z wysokiego punktu widokowego podczas „niebieskiej godziny”, z odpowiednimi ustawieniami przysłony, ISO i czasu otwarcia migawki, aby zrównoważyć słabe oświetlenie i żywe światła miasta”

Domw środku lasu : „Dom w środku lasu i duża rzeka po drugiej stronie domu, stara drewniana chata z omszałym dachem i dymem wydobywającym się z komina otoczona wysokimi, starymi drzewami, osadzona na tle czystej, szerokiej rzeki odbijającej nakrapiane światło słoneczne, zaszczepiając poczucie samotności i spokoju przy uspokajających dźwiękach płynącej wody i szelestu liści, uchwyconych w stylu fotografii, fotografii krajobrazowej za pomocą aparatu Canon EOS 5D Mark IV z wykorzystaniem obiektywu szerokokątnego dla szerszej perspektywy i mniejszej przysłony, aby utrzymać ostrość zarówno domu, jak i lasu.”

Zdjęcie stockowe przedstawiające lekarza i pacjenta: „Lekarz i pacjent, starannie skomponowana scena przedstawiająca lekarza w białym fartuchu ze stetoskopem na szyi, rozmawiającego z pacjentem siedzącym naprzeciwko niego w dobrze oświetlonej, nowoczesnej klinice opieki zdrowotnej, w atmosferze zaufania, empatii i nadziei, uchwycona na zdjęciu przy użyciu aparatu Canon EOS 5D Mark IV w trybie Portret, z ISO 100, przysłoną f/1,8, czasem otwarcia migawki 1/200 w celu uchwycenia wysokiej jakości, ostrych i szczegółowych wyrazów twarzy oraz tła bokeh”

Inne tryby Adobe Firefly:

  1. Generative Fill: Tryb ten pozwala użytkownikom na zmianę elementów bezpośrednio na obrazie, na przykład zmianę tła, dodanie elementów do modelu, zmianę koloru…. Krótko mówiąc, możliwości są prawie nieograniczone. Przyjrzymy się temu szczegółowo w późniejszym artykule.
  2. Efekty tekstowe: Ten tryb pozwala użytkownikom tworzyć tekst z generatywnym wypełnieniem zgodnie z podpowiedzią, jest dość prosty, ale trudny do opisania. To jest to, czego używam dla wyróżnionego obrazu w tym artykule
  3. Generative Recolor: Ten tryb umożliwia zmianę kolorów obrazów wektorowych. Jest to szybki sposób na przetestowanie kilku wariantów obrazu wektorowego.
  4. 3D to Image: Ten tryb przekształca elementy 3D, które ustawiasz zgodnie z wybraną perspektywą, w obraz 2D, oferując unikalną perspektywę i kreatywne możliwości. Narzędzie to nie jest jeszcze dostępne w chwili pisania tego tekstu.
  5. Rozszerz obraz: Ten tryb umożliwia „rozszerzenie” obrazu, tj. utworzenie kontynuacji obrazu po bokach nad nim. Ten tryb nie jest jeszcze dostępny w aplikacji online.

IV. Kilka przykładów użycia narzędzia

Jeśli chodzi o grafikę, to bez wątpienia jako pierwsi z Adobe Firefly skorzystają profesjonaliści zajmujący się projektowaniem. Na przykład sekcja „Generative Fill” może zaoszczędzić niesamowitą ilość czasu podczas testowania kilku wariantów projektu, zwłaszcza że Firefly jest teraz zintegrowany bezpośrednio z Photoshopem. Oszczędzasz czas, zwiększasz produktywność i odkrywasz pomysły projektowe, których nie byłbyś w stanie rozważyć ręcznie.

W reklamie i marketingu projektanci i marketerzy mogą korzystać z narzędzi takich jak Adobe Firefly do tworzenia dostosowanych reklam i treści dla swoich docelowych odbiorców. Obrazy stockowe mogą być tworzone na miarę. Obrazy te można stosunkowo łatwo dostosować, a testy A/B można przeprowadzić z 10 lub 20 różnymi wizualizacjami w oparciu o dane użytkowników, aby zmaksymalizować zaangażowanie i współczynniki konwersji. Nieźle, prawda?

Jeśli chodzi otworzenie stron internetowych, programiści mogą wykorzystywać sztuczną inteligencję do generowania obrazów i grafiki do projektowania stron internetowych. Pomaga to obniżyć koszty i czas spędzony na wyszukiwaniu lub tworzeniu obrazów.

W tworzeniu treści dla sieci społecznościowych sztuczna inteligencja może być wykorzystywana do tworzenia atrakcyjnych wizualnie i angażujących treści dla platform społecznościowych, w tym infografik, memów i innych udostępnianych obrazów.

W druku i publikacjach sztuczna inteligencja może być wykorzystywana do tworzenia obrazów dla mediów drukowanych, takich jak czasopisma, gazety i książki. Może to być przełom w tworzeniu treści wizualnych dla tych branż.

W grach i rozrywce twórcy gier i filmowcy mogą wykorzystywać sztuczną inteligencję do tworzenia obrazów i grafiki do swoich produkcji. Może to zaowocować bardziej realistyczną grafiką i bardziej wciągającymi wrażeniami dla widzów.

W modzie i projektowaniu odzieży sztuczna inteligencja może być wykorzystywana do tworzenia cyfrowych makiet projektów odzieży. Pozwala to projektantom wizualizować swoje kreacje przed ich wyprodukowaniem, oszczędzając czas i zasoby.

Wreszcie, w przypadku materiałów edukacyjnych i szkoleniowych, nauczyciele i trenerzy mogą wykorzystywać sztuczną inteligencję do tworzenia spersonalizowanych obrazów ilustrujących ich punkty. Może to pomóc w zwiększeniu zaangażowania i utrwaleniu informacji wśród uczniów lub stażystów.

V. Podsumowanie

Oto moja mała analiza Adobe Firefly: Jest to świetny generator obrazów oparty na sztucznej inteligencji, prawdziwa nowość stworzona przez Adobe. Pozwala tworzyć wysokiej jakości obrazy i zapierające dech w piersiach efekty tekstowe dzięki sztucznej inteligencji. Fajną rzeczą jest to, że jest zintegrowany bezpośrednio z całym pakietem aplikacji Adobe, więc dla twórców jest to duża zaleta, aby korzystać ze wszystkich jego zaawansowanych technologicznie funkcji bez opuszczania zwykłej rutyny pracy.

Firefly posiada kilka trybów w menu: Text to Image, Generative Fill, Text Effect, Generative Recolor, 3D to image i Extend Image, aby zaspokoić wszelkiego rodzaju kreatywne potrzeby. Każdy tryb ma swoje własne specyficzne funkcje, pozwalając użytkownikom tworzyć obrazy na zamówienie, odkrywać nowe pomysły, a nawet automatyzować niektóre zadania.

Trzeba przyznać, że Firefly nie jest jeszcze doskonały. Na przykład, nadal nieco zmaga się z dokładnością pisma odręcznego i podążaniem za podpowiedziami co do litery. Ale szczerze mówiąc, już teraz wykonuje świetną robotę, tworząc superrealistyczne, komercyjnie użyteczne obrazy. Nie zapominajmy też, że sztuczna inteligencja rozwija się w zawrotnym tempie. Postępy w tej dziedzinie z pewnością jeszcze bardziej zwiększą umiejętności Firefly.

Kiedy zobaczysz, co potrafi Adobe Firefly, zdasz sobie sprawę, że ma on ogromny potencjał w wielu dziedzinach: grafice, reklamie, tworzeniu stron internetowych, tworzeniu treści dla sieci społecznościowych, drukowaniu i publikowaniu, grach, rozrywce, modzie, projektowaniu odzieży, edukacji, szkoleniach itp.

W skrócie, Adobe Firefly oferuje bogactwo kreatywnych możliwości dzięki sztucznej inteligencji. Upraszcza proces tworzenia obrazów i otwiera nowe możliwości dla twórców, marketerów, programistów i innych profesjonalistów. Dzięki przyszłym ulepszeniom i integracji z istniejącymi aplikacjami Adobe, Firefly ma potencjał, aby stać się kluczowym graczem w przyszłości tworzenia wizualnego.

Similar Posts

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *