Gemini 2.5 Flash Image: нова модель Google для об’єднання зображень та редагування ШІ
Gemini 2.5 Flash Image, також відомий як nano-banana, – це вдосконалена модель створення та редагування зображень від Google, представлена у серпні 2025 року. Вона підтримує поєднання кількох зображень в одне, збереження узгодженості символів під час редагування, забезпечення цілеспрямованих трансформацій за допомогою природної мови та використання знань Gemini про світ для покращеного створення та редагування зображень.
Основні характеристики
- Узгодженість персонажів: Модель зберігає зовнішній вигляд персонажів або об’єктів у кількох підказках та редагуваннях, що дозволяє розміщувати їх у різних середовищах або створювати узгоджені елементи бренду.
- Редагування зображень на основі підказок: Користувачі можуть виконувати точне локальне редагування, таке як розмиття фону, видалення об’єктів, зміна поз або додавання кольору до чорно-білих зображень, використовуючи прості підказки природною мовою.
- Знання рідного світу: Gemini 2.5 Flash Image розуміє контекст і семантику реального світу, що дозволяє використовувати такі випадки, як інтерактивні освітні інструменти, які інтерпретують намальовані від руки діаграми та складні інструкції з редагування.
- Об’єднання кількох зображень: Модель може об’єднувати кілька вхідних зображень в одне фотореалістичне зображення, наприклад, розміщуючи об’єкти в нових сценах або змінюючи стиль кімнат за допомогою різних текстур або колірних схем.
Доступність та ціни
Модель доступна через Gemini API, Google AI Studio та Vertex AI для підприємств. Ціна встановлена на рівні 30 доларів США за 1 мільйон вихідних токенів , при цьому кожне зображення зазвичай коштує близько 0,039 долара США , виходячи з 1290 вихідних токенів на зображення. Усі інші способи введення та виведення відповідають цінам Gemini 2.5 Flash.
Інструменти та підтримка розробника
Google AI Studio оновлено до «режиму збірки», який дозволяє розробникам швидко тестувати, реміксувати та розгортати додатки на базі штучного інтелекту за допомогою Gemini 2.5 Flash Image. Шаблонні додатки демонструють такі функції, як узгодженість символів, редагування на основі підказок, об’єднання кількох зображень та інтерактивні навчальні інструменти. Розробники можуть зберігати код на GitHub або розгортати безпосередньо з AI Studio.
Партнерства та громада
OpenRouter.ai співпрацює з Google, щоб надати Gemini 2.5 Flash Image понад 3 мільйонам розробників, ставши першою моделлю генерації зображень на їхній платформі. Крім того, fal.ai, платформа для розробників генеративних медіа, допоможе розширити доступ до нього для ширшої спільноти розробників.
Автентичність зображення
Усі зображення, створені або відредаговані за допомогою Gemini 2.5 Flash Image, містять невидимий цифровий водяний знак SynthID, щоб ідентифікувати їх як згенеровані або відредаговані штучним інтелектом.
Приклад використання (Python)
| from google import genai
from PIL import Image from io import BytesIO
client = genai.Client()
prompt = “Create a picture of my cat eating a nano-banana in a fancy restaurant under the gemini constellation” image = Image.open(‘/path/to/image.png’)
response = client.models.generate_content( model=”gemini-2.5-flash-image-preview”, contents=[prompt, image], )
for part in response.candidates[0].content.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = Image.open(BytesIO(part.inline_data.data)) image.save(“generated_image.png”) |
Майбутні покращення
Google активно працює над покращенням відображення довгих текстів, підвищенням надійності відображення символів та підвищенням фактичної точності деталей зображень. Ми вітаємо відгуки через форум розробників та канали соціальних мереж.
Gemini 2.5 Flash Image зараз знаходиться в режимі попереднього перегляду, і незабаром планується стабільний реліз, який пропонує розробникам потужні нові інструменти для творчого та практичного створення та редагування зображень.
- AI Max виповнюється рік: нові інструменти для підвищення ефективності реклами та охоплення більшої аудиторії
- Google Ads змінює темп бюджетування з 1 червня 2026: що потрібно знати
- AI Max замінює DSA у Google Ads: автоматичне оновлення з вересня 2025
- Consent Mode Google Analytics та Google Ads: зміни з 15 червня 2026
- Commerce Media Suite Google: новий рівень eCommerce реклами