- Cudzoziemcy w biznesie
- Pierwszy biznes
- Rozwój biznesu
AI, to nie tylko ChatGPT

Damian Jemioło – Content Marketing | AI | Podcasty
Damian Jemioło posiada ponad 7 lat doświadczenia w content marketingu. Jest twórcą podcastów nagradzanych w branży (Kreatura 2023). Współpracował z markami takimi jak Ecadeo Jakuba Roskosza, Stratosfera, Agencja Plej, inStreamly, Pluxee (Sodexo) oraz e-Journalism University (napędzane przez Google News Initiative). Pisał do Nowego Marketingu, MamStartup, Marketing i Biznes oraz SecurityMagazine.pl. Jest również prelegentem Business Programme AI 2025.
AI to nie tylko ChatGPT – dowiedz się, jak korzystać z takich narzędzi jak: Ideogram, NotebookLM i ElevenLabs
Generatywna sztuczna inteligencja obejmuje wiele różnych narzędzi, które pozwalają tworzyć rzeczy, jakie ChatGPT nie potrafi albo robi je znacznie gorzej od dedykowanych narzędzi. Dowiedz się, jak korzystać z Ideograma, NotebookaLM czy ElevenLabs.
Spis treści:
- Ideogram – co to właściwie jest i dlaczego robi różnicę?
- Jak pisać prompty do Ideograma?
- Jak dodawać napisy w Ideogram?
- ElevenLabs – jak generować głos?
- Jak ustawić ElevenLabs, żeby uzyskać jak najlepszy efekt?
- Jak klonować głos w ElevenLabs?
- NotebookLM – interaktywny notatnik
- FAQ – Najczęściej zadawane pytania
Ideogram – co to właściwie jest i dlaczego robi różnicę?
Ideogram to narzędzie AI, które zamienia Twoje słowa w obraz. Albo przekształca jedne obrazy (jako grafiki referencyjne) w drugie. Mówiąc inaczej: działa w technologii text-to-image oraz image-to-image. Podobnie, jak Midjourney czy nawet sam ChatGPT.
Jednak w przeciwieństwie do tego drugiego, tworzy znacznie bardziej realistyczne grafiki. A to dlatego, że jest narzędziem stricte dedykowanym jednemu konkretnemu zadaniu. Nie jest to narzędzie multimodalne.
Nie musisz znać Photoshopa, ani ręki artysty (tylko musisz wiedzieć, co chcesz osiągnąć). Wpisujesz prompt – czyli opis sceny – a system generuje grafikę. Może to być realistyczne zdjęcie, ilustracja akwarelowa, plakat retro albo logo z napisem wkomponowanym w obraz.
I to właśnie wyróżnia Ideogram – jako jedno z nielicznych narzędzi AI potrafi tworzyć obrazy z tekstem, który wygląda jak prawdziwa typografia, a nie losowe bazgroły (w nowych modelach popularnych generatywnych AI jest z tym coraz lepiej, ale Ideogram często ciągle robi to skuteczniej).
Jak pisać prompty do Ideograma?
Promptowanie jest najważniejsze. Ucz się tego. To nierzadko potrafi dać o wiele lepsze efekty niż wybór konkretnego narzędzia czy modelu. Co ważne – jeśli nauczysz się tworzyć dobre instrukcje do AI raz, to nawet jeśli przerzucisz się na inne, niewiele się dla Ciebie zmieni. No, poza interfejsem.
A najważniejszą rzeczą w promptowaniu jest dokładność. Załóżmy, że wpisujesz prompt: „ wygeneruj czerwony rower”. Co to jest „czerwony”? Cynober (#E34234), karmin (#960018), czerwień żelazowa (#801818) – wiesz co je łączy? Wszystkie są kolorem czerwonym. Skąd AI ma wiedzieć, co masz na myśli, kiedy wpisujesz takie słowo? Najpewniej w takiej sytuacji wygeneruje najbardziej typowy czerwony, czyli: #FF0000.
To samo enigmatyczne słowo: „człowiek”. Kto to jest człowiek? 25-letni biały mężczyzna? 67-letnia czarna kobieta? Wysoki ten człowiek? Niski? Szczupły, gruby? Wszystko to musisz zawrzeć w prompcie. Myśl o tym np. jak o briefie dla grafika komputerowego.
W promptach do Ideograma i innych generatorów grafik musisz uwzględniać takie rzeczy jak:
- Dokładny opis koloru, np. karmin zamiast zwykłego „czerwonego”. Ważna może okazać się też kolorystyka czy użyte tony, np. zimne, ciepłe itp.;
- Opis tego, co powinno znaleźć się na zdjęciu, w jakiej pozycji, w którym miejscu itp.;
- Kąt widzenia, perspektywa, układ w kadrze;
- Jakie światło (twarde, miękkie, rozproszone, padające z boku, półmrok), jaki nastrój (wesoły, ponury, poważny itd.);
- Opis miejsca, co ma się pojawić w tle, gdzie jest miejsce akcji;
- Styl grafiki: fotorealistyczny, animowany, kreskówkowy, rycina, kubizm – wpisuj cokolwiek wpadnie Ci do głowy, a chcesz, żeby Ideogram oddał tego charakter.
Co więcej – twórz prompty w języku angielskim. W przypadku Ideograma czy Midjourney (i niektórych innych generatorów grafik), pisanie po polsku może nie działać albo nie dawać wymiernych efektów.
Poza tym zwróć uwagę na tzw. negatywne prompty. Unikaj wpisywania do promptów takich słów jak: „nie”. AI ciągle gorzej radzi sobie z tymi negatywnymi instrukcjami. Przykładowo, zamiast pisać: „a person without hair” napisz po prostu: „a bald person”. Zamiast: „No people on the street” napisz: „An empty street at sunrise”.
Jak dodawać napisy w Ideogram?
Ideogram potrafi generować napisy na grafikach i to naprawdę dobrze. Musisz jednak sprecyzować, o jaki napis chodzi i gdzie ma być umieszczony. Jeśli napiszesz tylko hasło, AI wrzuci je gdzieś w kadr. Jeśli powiesz mu dokładnie, jak, gdzie i w jakim stylu ma wyglądać tekst – dostaniesz projekt, który wygląda jak gotowy do druku.
Przykład: A vintage poster design with the words ‘Ride Free’ curving along the bottom in bold retro lettering, featuring a smiling woman on a bicycle on a countryside road.
Tekst jest w paragrafach. Pojawia się wcześnie, więc AI traktuje go jako priorytet. I nie zostawiasz go samemu sobie – opisujesz krój, kolor, pozycję. Dzięki temu litery nie będę wyglądać jak na doczepkę.
Możesz iść dalej. Zamiast jednego napisu, ustaw kilka warstw:
A concert poster design with the title ‘Jazz Nights’ at the top in glowing neon script, and the phrase ‘Live at the Blue Note’ centered at the bottom in small white sans serif.
Teraz już wiesz, jak korzystać z Ideograma. Wypróbuj ten prompt i staraj się naśladować tę strukturę:
Nastrojowy akwarelowy obraz przedstawiający małą dziewczynkę na łące pełnej kwiatów. Dziewczynka ma potargane brązowe włosy, różowe policzki i nosi jaskrawożółtą sukienkę. Trzyma w ramionach puszystego białego króliczka, który delikatnie opiera się o jej pierś, a jego uszy opadają, jakby porwał je podmuch wiatru. Wokół rozkwitają polne kwiaty w odcieniach lawendy, żółtych jaskrów i wiśniowej czerwieni, nad którymi unoszą się motyle, a obok spoczywa mały koszyk piknikowy. Scena rozgrywa się na otwartej, trawiastej łące pod miękkim, pastelowoniebieskim niebem, z odległymi wzgórzami zanikającymi w zamglonym horyzoncie. Światło jest ciepłe i złote, jak w późne popołudnie, a promienie przesączające się przez rozproszone chmury tworzą senny, nasłoneczniony nastrój. Kompozycja umieszcza dziewczynkę i króliczka nieco poza centrum, uchwyconych z łagodnego ujęcia z góry, co nadaje scenie intymności. Luźne pociągnięcia pędzla i subtelne rozmycia barw tworzą fakturę, a miękkie krawędzie i płytka głębia ostrości dodają uroku oraz profesjonalnego, dopracowanego charakteru.
ElevenLabs – jak generować głos?
Pamiętasz Ivonę? Syntezator mowy stworzony przez firmę z Gdyni, który rozbrzmiewał w komunikacji miejskiej, na dworcach czy filmikach na YouTubie albo legendarnych Spryciarzach.pl. Wykorzystywał sklonowany przez sieci neuronowe głos aktora Jacka Labijaka. Długa historia – warto jej się przyjrzeć, ale tu popatrzymy na inne narzędzie stworzone przez Polaków – ElevenLabs.
To również sieci neuronowe, tak, dość „stara technologia”, bo przecież Ivona powstała w 2001 r. W skrócie – ElevenLabs umożliwia m.in. generowanie głosu, przekształcając tekst na mowę (text-to-speech), mowę na mowę (speech-to-speech), jak i również pozwala na sklonowanie swojego własnego głosu.
Jak ustawić ElevenLabs, żeby uzyskać jak najlepszy efekt?
Działa to wszystko w bardzo prosty sposób. Kliknij: “Instant speech”, a następnie przejdziesz do text-to-speech. Tam po prostu wpisz tekst od 3000 (jeśli korzystasz z modelu v3) do 5000 znaków ze spacjami (jeśli korzystasz z modelu v2). Dowolny tekst, nawet: Nazywam się Jan Kowalski, urodziłem się w Warszawie w 1980 roku. Uwielbiam wędkować i ćwiczyć na siłowni. Nie cierpię pasztetu.
I kliknij generate speech. Jak zapewne zauważysz – tekst będzie taki sobie, dość suchy. I teraz pytanie: jak sprawić, żeby AI nie brzmiał jak Ivona sprzed 24 lat, tylko brzmiał bardziej ludzko?
Człowiek nie mówi jednym tonem – akcentuje, podnosi głos, robi pauzy. Ty musisz te sygnały zostawić w tekście. Jak? Wielkie litery to Twój sojusznik. Napisz „UWIELBIAM świeżo zerwane truskawki” – AI podkreśli to słowo dokładnie tak, jakbyś powiedział je głośniej. Chcesz emocji? Dorzuć wykrzyknik, nawet dwa. Pytanie retoryczne? Pytajnik zadziała jak podniesienie tonu.
Alternatywnie możesz zastosować didaskalia jak w scenariuszu. Np.: „Uwielbiam świeżo zerwane truskawki – powiedział entuzjastycznie”. Minus takiego rozwiązania? Montaż. Będzie trzeba te didaskalia wycinać po wygenerowaniu dźwięku, bo AI je przeczyta, nie potraktuje jako instrukcji sensu stricto, tylko część tekstu.
Drugie narzędzie to interpunkcja. Wielokropki, pauzy, półpauzy – one zmuszają AI do złapania oddechu. A jeśli potrzebujesz dłuższej ciszy, wstaw <break time=”2s”> i dostajesz pauzę jak w radiowej narracji.
Co jeszcze możesz zrobić dla lepszego efektu? Po prawej stronie swojego panelu masz suwaki. Stability – od 70 do 75% daje bezpieczną, płynną narrację, ale jeśli chcesz teatralności, obniżaj. Stability – sprawia, że głos będzie bardziej spójny między kolejnymi generacjami, ale może też brzmieć monotonnie, dlatego przy dłuższych tekstach zaleca się obniżenie tej wartości.
Similarity – zwiększa klarowność głosu i stabilizuje jego poziom, żeby przy kolejnych generacjach zgadzał się ton. Zazwyczaj ustawia się to na 40–50%. Exaggeration – tu ostrożnie. Podnosi ekspresję, ale jeśli przesadzisz, głos rozjedzie się i zabrzmi sztucznie. Suwaki na razie są dostępne tylko w modelu v2. W v3 mamy wyłącznie stability.
Co ważne – oprócz funkcji text-to-speech, masz też opcję speech-to-speech. Jeśli pomimo wcześniejszych ustawień Twoim zdaniem głos AI nadal jest za “suchy”, pozbawiony emocji i tonów, możesz nagrać daną kwestię samemu i zamienić swój głos na wybrany inny.
Jak klonować głos w ElevenLabs?
Klonowanie głosu w ElevenLabs sprowadza się do dwóch metod – szybkiej (IVC – Instant Voice Cloning) i dokładniejszej (PVC – Professional Voice Cloning). Obie bazują na sieciach neuronowych, ale różnią się wymaganiami i jakością efektów.
Instant Voice Cloning to opcja dla osób, które chcą błyskawicznie stworzyć własny klon. Wystarczy krótka próbka głosu – od 10 sekund do 2 minut. Nagranie powinno być czyste, bez hałasów i zakłóceń. Wgrywasz plik, potwierdzasz prawa do nagrania i po chwili otrzymujesz gotowy model.
To najszybsza droga, dostępna w subskrypcji za 5 dolarów miesięcznie. Jakość w większości przypadków jest wystarczająca, choć przy bardziej charakterystycznych głosach mogą pojawić się drobne różnice.
Professional Voice Cloning wymaga więcej wysiłku – od 30 minut do kilku godzin nagrań. System na tej bazie buduje indywidualny model, który lepiej odwzorowuje barwę, intonację i emocje. Tu liczy się różnorodność próbek: narracja, dialog, fragmenty pełne emocji. Potrzebny jest porządny mikrofon i pozbawione szumów otoczenie. Dostępne jest to w subskrypcji za 22 dolary miesięcznie, a na efekt czeka się zwykle kilka godzin, ale otrzymujesz głos, który jest niemal nie do odróżnienia od oryginału.
Po wybraniu metody dodajesz głos w panelu Voices, nadajesz mu nazwę i możesz używać w funkcjach Text-to-Speech, podcastach, filmach czy audiobookach. W praktyce wybór sprowadza się do tego, czy bardziej zależy Ci na czasie i prostocie, czy na maksymalnej naturalności i pełnym oddaniu charakteru głosu.
NotebookLM – interaktywny notatnik
NotebookLM to narzędzie, do którego wrzucasz swoje źródła – PDF-y, artykuły, notatki, linki do stron, filmiki z YouTube’a czy nagrania audio w formatach MP3 i WAV – a ono je transkrybuje, analizuje i pozwala Ci zadawać pytania. Pomyśl o tym, jak o interaktywnym notatniku, w którym nie tyle szukasz tego, co zapisałeś, ale możesz pogłębić tę wiedzę.
Klucz tkwi w tym, że nie musisz ograniczać się do jednego formatu – NotebookLM obsługuje:
- Pliki z Google Drive (Docs, Slides, Sheets).
- PDF-y i pliki tekstowe.
- Fragmenty wklejonego tekstu.
- Linki do stron i filmy z YouTube’a.
- Audio w .mp3 i .wav (system sam robi transkrypcję).
Najważniejsze jest to, że możesz wrzucić np. wideo po polsku albo nagranie spotkania i w kilka minut dostajesz transkrypcję, streszczenie albo notatki, które później odpytywane są jak baza danych. Chcesz znaleźć fragment o budżecie z długiego zebrania? NotebookLM wyciągnie dokładny cytat i pokaże źródło, żebyś wiedział, skąd ta informacja pochodzi.
Każda odpowiedź ma przypięty cytat ze źródła – klikasz i od razu wiesz, skąd informacja pochodzi. To oznacza mniej halucynacji (co nie oznacza, że nie ma ich wcale, wszystkie LLM-y halucynują) i więcej kontroli. Dodatkowo kontekst okna jest gigantyczny – setki stron PDF-ów traktowane jak krótka notatka. Możesz pracować równocześnie na wielu źródłach i w kilka minut mieć obraz całości.
Inna mocna funkcja to przekształcanie treści. Jednym kliknięciem generujesz mapę myśli, study guide, listę pytań i odpowiedzi, podsumowanie itd. itp. Każdy element można przypiąć do notatek, łączyć ze sobą i tworzyć własne zestawy wiedzy. To sprawia, że zamiast walczyć z nadmiarem materiałów, masz z nich gotowe narzędzia do działania.
Co więcej – NotebookLM może dla Ciebie tworzyć „podcasty”, czyli podsumowania audio, a od niedawna także wideo. Traktuję to jednak bardziej jako „wodowtrysk”. Tak, może to być przydatne w sytuacji, kiedy wolisz mieć notatki w wersji dźwiękowej niż tekstowej, ale niekoniecznie jest to szczególnie przydatna funkcja.
Przykłady użycia:
- Student: wrzuca podręcznik i nagranie wykładu, następnie dostaje study guide i transkrypcję, a potem pyta NotebookLM o definicje i przykłady. Dzięki temu uczy się szybciej.
- Menedżer: wrzuca nagranie ze spotkania, robi notatki za pomocą NotebookLM, wyciąga najistotniejsze fragmenty i wysyła gotowy briefing dla zarządu.
- Marketer: wrzuca kilka artykułów branżowych i filmiki z YouTube, NotebookLM generuje mapę trendów i FAQ, a marketer zyskuje bazę wiedzy do kampanii.
Jak widzisz – możliwości generatywnego AI są spore i nie ma sensu ograniczać się wyłącznie do prostego generowania tekstu za pomocą ChataGPT.
FAQ – Najczęściej zadawane pytania
1. Czym jest Ideogram i dlaczego warto go wybrać zamiast innych generatorów obrazów AI?
Ideogram to narzędzie sztucznej inteligencji do tworzenia grafik w technologii text-to-image oraz image-to-image. Wyróżnia się tym, że generuje realistyczne obrazy oraz pozwala tworzyć napisy wyglądające jak prawdziwa typografia – czego konkurencja często nie robi aż tak dobrze. Dodatkowo oferuje wersję bezpłatną – z 12 kredytami tygodniowo.
2. Jak pisać skuteczne prompty w Ideogramie, aby generować profesjonalne grafiki?
Najlepsze efekty osiągniesz, jeśli w promptach uwzględnisz precyzyjne opisy kolorów, perspektywy, światła, nastroju i szczegółów postaci czy obiektów. Myśl o promptach jak o briefie dla grafika komputerowego – im dokładniejsze, tym lepsze rezultaty.
3. Co to jest ElevenLabs i jak działa syntezator mowy oparty na AI?
ElevenLabs to zaawansowane narzędzie AI do generowania naturalnie brzmiących głosów. Umożliwia nie tylko konwersję tekstu na mowę, ale także klonowanie swojego własnego głosu czy podmienianie jednego głosu (np. męskiego) na drugi (np. żeński).
4. Jak wykorzystać ElevenLabs w biznesie i marketingu?
Z ElevenLabs stworzysz narrację do reklam, audiobooków, podcastów, materiałów szkoleniowych itd. itp. Jeśli początkowy efekt Cię nie zadowoli, zawsze możesz użyć opcji: „Regenerate” – nie bój się dokonywać iteracji w przypadku pracy z generatywnym AI.
5. Czym jest NotebookLM i jakie problemy rozwiązuje?
NotebookLM to narzędzie AI od Google pełniące funkcję inteligentnego asystenta do tworzenia notatek. Analizuje dokumenty, sporządza podsumowania i odpowiada na pytania na podstawie wgranych plików. Dzięki temu oszczędza czas przy pracy z dużą ilością materiałów i eliminuje konieczność ręcznego wyszukiwania informacji.
6. Jak NotebookLM wspiera biznes i procesy decyzyjne?
W firmach NotebookLM tworzy transkrypcje ze spotkań, generuje streszczenia raportów, przygotowuje notatki i mapy myśli. Ułatwia to szybkie podejmowanie decyzji i tworzenie treści opartych na danych. Zamiast godzin analizy dokumentów, użytkownik dostaje gotowe odpowiedzi i konkretne insighty w kilka chwil.