Nowa era możliwości dla deweloperów
Od premiery Gemini 1.0 w grudniu zeszłego roku miliony deweloperów wykorzystały Google AI Studio i Vertex AI, aby tworzyć aplikacje w 109 językach. Teraz, dzięki premierze Gemini 2.0 Flash Experimental, otwierają się jeszcze bardziej interaktywne i immersyjne możliwości, a także narzędzia wspierające programistów w codziennej pracy.
Nowości Gemini 2.0 Flash
Lepsza wydajność
Gemini 2.0 Flash jest dwa razy szybszy od poprzedniej wersji 1.5 Pro, oferując jeszcze lepszą wydajność w przetwarzaniu tekstu, kodu, obrazu oraz danych przestrzennych. Nowa wersja wprowadza również udoskonalone zrozumienie przestrzenne, pozwalające dokładniej identyfikować małe obiekty w zatłoczonych obrazach.
Nowe tryby wyjściowe
Deweloperzy mogą teraz generować odpowiedzi zawierające tekst, dźwięk i obrazy w jednym wywołaniu API. Wprowadzone niewidzialne znaki wodne SynthID w treściach wizualnych i audio pomagają zmniejszyć ryzyko dezinformacji.
- Wyjście audio w wielu językach: Gemini 2.0 umożliwia precyzyjne sterowanie treścią i stylem wypowiedzi w 8 głosach wysokiej jakości.
- Wyjście obrazów: Nowa funkcja pozwala generować i edytować obrazy w wieloetapowych rozmowach, idealne do multimodalnych aplikacji, takich jak przepisy kulinarne.
Wykorzystanie narzędzi natywnych
Gemini 2.0 Flash obsługuje narzędzia, takie jak Google Search i funkcje wykonywania kodu, co umożliwia lepsze tworzenie doświadczeń opartych na działaniach AI. Wyszukiwanie równoległe zapewnia szybsze i dokładniejsze pozyskiwanie informacji z wielu źródeł.
Multimodal Live API
Dzięki tej funkcji deweloperzy mogą tworzyć aplikacje działające w czasie rzeczywistym z danymi wideo i audio. API obsługuje naturalne wzorce konwersacyjne, takie jak przerwania i wykrywanie aktywności głosowej, co otwiera nowe możliwości dla bardziej złożonych przypadków użycia.
Kodowanie z AI: Nowy poziom automatyzacji
Agenci kodowania w akcji
Gemini 2.0 Flash wprowadza Julesa, eksperymentalnego agenta kodowania wspieranego AI. Jules integruje się z GitHub, naprawiając błędy i automatyzując żmudne zadania programistyczne. Agent potrafi planować wieloetapowe poprawki, edytować wiele plików i tworzyć pull requesty.
Innowacje dla startupów i deweloperów
Już teraz Gemini 2.0 Flash jest wykorzystywany przez startupy do prototypowania takich funkcji jak:
- Wirtualne postacie i narracje audio,
- Tłumaczenia kontekstowe w wielu językach,
- Analiza wideo i eksploracja danych przestrzennych na stronach internetowych
Aby ułatwić start, Google AI Studio udostępnia otwarte źródła kodu i aplikacje startowe.