Ile wody zużywa AI?

Ile wody zużywa sztuczna inteligencja?

Założę się, że słyszałeś już wszystko, od „AI wypija butelkę wody co kilka pytań” po „to w zasadzie kilka kropli”. Prawda jest bardziej złożona. Zużycie wody przez AI zmienia się w zależności od tego, gdzie działa, jak długo trwa Twoje zapytanie i jak centrum danych chłodzi swoje serwery. Tak, ta liczba istnieje, ale kryje się w gąszczu zastrzeżeń.

Poniżej analizuję przejrzyste, gotowe do podjęcia decyzji liczby, wyjaśniam, dlaczego szacunki są rozbieżne i pokazuję, w jaki sposób deweloperzy i zwykli użytkownicy mogą zmniejszyć rachunki za wodę, nie popadając przy tym w manię zrównoważonego rozwoju.

Artykuły, które mogą Ci się spodobać po przeczytaniu tego:

🔗 Czym jest zbiór danych AI
Wyjaśnia, w jaki sposób zbiory danych umożliwiają szkolenie uczenia maszynowego i rozwój modeli.

🔗 Jak sztuczna inteligencja przewiduje trendy
Pokazuje, w jaki sposób sztuczna inteligencja analizuje wzorce, aby prognozować zmiany i przyszłe wyniki.

🔗 Jak mierzyć wydajność sztucznej inteligencji
Przedstawia podstawowe wskaźniki służące ocenie dokładności, szybkości i niezawodności.

🔗 Jak rozmawiać ze sztuczną inteligencją
Przewodnik po skutecznych strategiach podpowiadania, które mają na celu poprawę przejrzystości, wyników i spójności.


Ile wody zużywa sztuczna inteligencja? Szybkie liczby, które możesz wykorzystać 📏

  • Typowy zakres dla każdego monitu wynosi obecnie: od ułamka mililitra dla mediany monitu tekstowego w jednym głównym systemie, do dziesiątek mililitrów dla dłuższej odpowiedzi o większych wymaganiach obliczeniowych w innym. Na przykład, raport Google’a dotyczący produkcji raportuje medianę monitu tekstowego na poziomie ~0,26 ml (z uwzględnieniem pełnego narzutu na obsługę) [1]. Ocena cyklu życia Mistrala określa odpowiedź asystenta na 400 tokenów na poziomie ~45 ml (wnioskowanie marginalne) [2]. Kontekst i model mają ogromne znaczenie.

  • Szkolenie modelu na skalę graniczącą z przemysłem: może wymagać zużycia milionów litrów , głównie z chłodzenia i wody wykorzystywanej do wytwarzania energii elektrycznej. W szeroko cytowanej analizie akademickiej oszacowano, że do wyszkolenia modelu klasy GPT około 5,4 miliona litrów około 700 000 litrów zużywanych na miejscu do chłodzenia – i argumentowano za inteligentnym planowaniem w celu obniżenia intensywności zużycia wody [3].

  • Centra danych ogólnie: duże obiekty obejmują średnio setki tysięcy galonów dziennie

Bądźmy szczerzy: te liczby na pierwszy rzut oka wydają się niespójne. Bo są. I są ku temu dobre powody.

 

Spragniona sztuczna inteligencja

Wskaźniki zużycia wody oparte na sztucznej inteligencji ✅

Dobra odpowiedź na pytanie „ Ile wody zużywa sztuczna inteligencja?” powinna spełniać kilka warunków:

  1. Jasność granic
    Czy obejmuje ona wyłącznie chłodzącą na miejscu , czy również spoza obiektu, wykorzystywaną przez elektrownie do wytwarzania energii elektrycznej? Najlepsze praktyki rozróżniają pobór wody i jej zużycie oraz zakresy 1-2-3, podobnie jak w przypadku rozliczania emisji dwutlenku węgla [3].

  2. Wrażliwość na lokalizację
    Ilość wody na kWh różni się w zależności od regionu i mieszanki sieciowej, więc ta sama usługa może mieć różny wpływ na zużycie wody w zależności od miejsca, w którym jest dostarczana – jest to główny powód, dla którego w literaturze zaleca się planowanie uwzględniające czas i miejsce [3].

  3. Realizm obciążenia
    Czy liczba odzwierciedla medianę monitów produkcyjnych , w tym bezczynną moc obliczeniową i obciążenie centrum danych, czy tylko akcelerator w szczytowym momencie? Google podkreśla, że ​​do wnioskowania wykorzystuje się pełne rozliczenie systemu (bezczynność, procesory/pamięć DRAM i obciążenie centrum danych), a nie tylko obliczenia TPU [1].

  4. Technologia chłodzenia
    Chłodzenie parowe, chłodzenie cieczą w obiegu zamkniętym, chłodzenie powietrzem i nowe „direct-to-chip” radykalnie zmieniają intensywność chłodzenia wodą. Firma Microsoft wdraża projekty mające na celu wyeliminowanie użycia wody chłodzącej w niektórych lokalizacjach nowej generacji [4].

  5. Pora dnia i pora roku
    Ciepło, wilgotność i warunki sieci wpływają na efektywność wykorzystania wody w życiu rzeczywistym; jedno z wpływowych badań sugeruje planowanie głównych zadań w czasie i miejscu, w którym intensywność zużycia wody jest niższa [3].


Pobieranie wody a jej spożycie – wyjaśnienie 💡

  • Pobór = woda pobrana z rzek, jezior lub warstw wodonośnych (część zwrócona).

  • Zużycie = woda, która nie jest zwracana, ponieważ odparowuje lub zostaje włączona do procesów/produktów.

zużywają głównie poprzez parowanie. Produkcja energii elektrycznej może zużywać duże ilości wody (czasem zużywając jej część), w zależności od instalacji i metody chłodzenia. Wiarygodne etykiety AI-water number labelling, które raportuje [3].


Gdzie trafia woda w AI: trzy wiadra 🪣

  1. Zakres 1 – chłodzenie na miejscu
    Część widoczna: woda odparowuje w samym centrum danych. Punktem wyjścia są wybory projektowe, takie jak chłodzenie parowe, powietrzne lub cieczowe w obiegu zamkniętym [5].

  2. Zakres 2 — wytwarzanie energii elektrycznej
    Każda kWh może mieć ukryty znacznik wody; mieszanka i lokalizacja określają sygnał litrów na kWh, który dziedziczy obciążenie [3].

  3. Zakres 3 – łańcuch dostaw.
    Produkcja układów scalonych opiera się na wykorzystaniu ultraczystej wody. Nie będzie to widoczne w metryce „na żądanie”, chyba że granica wyraźnie uwzględnia wpływy ucieleśnione (np. pełna analiza cyklu życia) [2][3].


Dostawcy w liczbach, z niuansami 🧮

  • Google Gemini wyświetla komunikat
    o metodzie obsługi pełnego stosu (wliczając w to bezczynność i obciążenie obiektu). Mediana komunikatu tekstowego to ~0,26 ml wody przy ~0,24 Wh energii; liczby odzwierciedlają ruch produkcyjny i kompleksowe granice [1].

  • Cykl życia Mistral Large 2
    Rzadka niezależna analiza cyklu życia (z ADEME/Carbone 4) ujawnia ~281 000 m³ na potrzeby szkolenia + wczesnego wykorzystania i margines wnioskowania ~45 mL na 400 tokenów [2].

  • Ambicja firmy Microsoft dotycząca chłodzenia bez użycia wody
    Centra danych nowej generacji są projektowane tak, aby nie zużywać żadnej wody do chłodzenia , opierając się na podejściu bezpośrednio do układu scalonego; zastosowania administracyjne nadal wymagają pewnej ilości wody [4].

  • Ogólna skala centrów danych
    Duzi operatorzy publicznie podają, poszczególnych lokalizacji wynosi setki tysięcy galonów dziennie

  • Wcześniejsza baza akademicka,
    pionierska analiza „spragnionej sztucznej inteligencji”, oszacowała, że ​​do wyszkolenia modeli klasy GPT milionów litrów 10–50 odpowiedzi o średniej objętości może w przybliżeniu odpowiadać o pojemności 500 ml – w dużej mierze zależy to od tego, kiedy i gdzie zostaną przeprowadzone [3].


Dlaczego szacunki są tak rozbieżne?

  • Różne granice
    Niektóre dane uwzględniają jedynie chłodzenie na miejscu , inne dodają wodę wygenerowaną przez energię elektryczną , a analizy cyklu życia mogą uwzględniać produkcję układów scalonych . Jabłka, pomarańcze i sałatka owocowa [2][3].

  • Różne obciążenia
    Krótki tekstowy monit nie jest długim multimodalnym przebiegiem kodu; cele przetwarzania wsadowego, współbieżności i opóźnień zmieniają wykorzystanie [1][2].

  • Różne klimaty i siatki
    Chłodzenie parowe w gorącym, suchym regionie ≠ chłodzenie powietrzem/cieczą w chłodnym i wilgotnym regionie. Intensywność wody w siatce jest bardzo zróżnicowana [3].

  • Metodologie dostawców
    : Google opublikował metodę obsługi całego systemu; Mistral opublikował formalną analizę cyklu życia (LCA). Inni oferują szacunki punktowe z wykorzystaniem metod rozproszonych. Głośne o „jednej piętnastej łyżeczki” na komunikat trafiło na pierwsze strony gazet – ale bez szczegółowych danych dotyczących granic nie można go porównywać [1][3].

  • Ruchomy cel
    Chłodzenie szybko ewoluuje. Microsoft testuje chłodzenie bezwodne w niektórych lokalizacjach; wdrożenie tych rozwiązań zmniejszy zużycie wody na miejscu, nawet jeśli sieć elektryczna w górnym biegu nadal przesyła sygnał o wodzie [4].


Co możesz zrobić już dziś, aby zmniejszyć ślad wodny sztucznej inteligencji?

  1. Dopasuj rozmiar modelu.
    Mniejsze modele, dostrojone do zadań, często osiągają dokładność, zużywając mniej mocy obliczeniowej. Ocena Mistrala podkreśla silną korelację między rozmiarem a zajmowaną powierzchnią – i publikuje marginalne liczby wnioskowania, dzięki czemu można wnioskować o kompromisach [2].

  2. Wybieraj regiony oszczędzające wodę
    Preferuj regiony o chłodniejszym klimacie, wydajnym chłodzeniu i sieciach o niższym natężeniu zużycia wody na kWh; praca „spragnionej sztucznej inteligencji” pokazuje, że uwzględniające czas i miejsce jest pomocne [3].

  3. Przesuwanie obciążeń pracą w czasie
    Zaplanuj szkolenie/intensywne wnioskowanie wsadowe na godziny efektywnego wykorzystania wody (chłodniejsze noce, korzystne warunki sieci) [3].

  4. Poproś swojego dostawcę o przejrzyste dane
    dotyczące zapotrzebowania na wodę na żądanie , definicje granic oraz informację, czy liczby uwzględniają niewykorzystaną moc i obciążenie obiektu. Grupy polityczne naciskają na obowiązkowe ujawnianie informacji, aby umożliwić porównywanie podobnych produktów [3].

  5. Technologia chłodzenia ma znaczenie
    Jeśli zajmujesz się sprzętem, rozważ chłodzenie w obiegu zamkniętym/bezpośrednio do układu scalonego ; jeśli korzystasz z chmury, preferuj regiony/dostawców inwestujących w projekty o małej mocy obliczeniowej [4][5].

  6. Wykorzystanie szarej wody i możliwości jej ponownego wykorzystania
    Wiele kampusów może zastąpić źródła wody niepitnej lub poddawać recyklingowi w ramach obiegów; duzi operatorzy opisują równoważenie źródeł wody i możliwości chłodzenia w celu zminimalizowania wpływu netto [5].

Szybki przykład, aby to urzeczywistnić (choć nie jest to uniwersalna reguła): przeniesienie nocnego szkolenia z gorącego, suchego regionu w środku lata do chłodniejszego, bardziej wilgotnego regionu wiosną – i uruchomienie go poza godzinami szczytu, w chłodniejszych godzinach – może zmienić zarówno zużycie wody na miejscu poza miejscem (siecią). Właśnie taki praktyczny, bezproblemowy harmonogram może przynieść korzyści [3].


Tabela porównawcza: szybkie wskazówki, jak obniżyć zużycie wody przez AI 🧰

narzędzie publiczność cena dlaczego to działa
Mniejsze modele dostosowane do zadań Zespoły ML, kierownicy ds. produktów Niska–średnia Mniej obliczeń na token = mniej chłodzenia + mniej prądu i wody; udowodniono w raportowaniu w stylu LCA [2].
Wybór regionu według wody/kWh Architekci chmury, zaopatrzenie Średni Przejście na chłodniejszy klimat i sieci o mniejszym zużyciu wody; połączenie z trasowaniem uwzględniającym zapotrzebowanie [3].
Okna treningowe o różnych porach dnia MLOps, harmonogramy Niski Chłodniejsze noce i lepsze warunki sieci obniżają efektywną intensywność wody [3].
Chłodzenie bezpośrednio do układu scalonego/zamknięte Operacje w centrum danych Średnio-wysoki W miarę możliwości unika się wież wyparnych, co pozwala ograniczyć zużycie energii na miejscu [4].
Długość monitu i kontrola partii Twórcy aplikacji Niski Ogranicz liczbę niekontrolowanych tokenów, przetwarzaj partie inteligentnie, buforuj wyniki; mniej milisekund, mniej mililitrów [1][2].
Lista kontrolna przejrzystości dostawców Dyrektorzy ds. technologii, liderzy ds. zrównoważonego rozwoju Bezpłatny Wymusza jasność granic (na miejscu i poza miejscem) oraz raportowanie porównawcze [3].
Szara woda lub źródła odzyskane Obiekty, gminy Średni Zastąpienie wody niezdatnej do picia zmniejsza obciążenie zasobów wody pitnej [5].
Partnerstwa na rzecz ponownego wykorzystania ciepła Operatorzy, rady lokalne Średni Lepsza sprawność cieplna pośrednio obniża zapotrzebowanie na chłodzenie i buduje lokalną dobrą wolę [5].

(„Cena” jest z założenia niska — wdrożenia są różne.)


Głębokie nurkowanie: rytm polityki staje się coraz głośniejszy 🥁

Organizacje inżynieryjne wzywają do obowiązkowego ujawniania informacji o zużyciu energii i wody w centrach danych, aby nabywcy i społeczności mogli oceniać koszty i korzyści. Zalecenia obejmują definicje zakresu, raportowanie na poziomie lokalizacji oraz wytyczne dotyczące lokalizacji – ponieważ bez porównywalnych, uwzględniających lokalizację wskaźników, prowadzimy dyskusję po omacku ​​[3].


Głęboka analiza: nie wszystkie centra danych zużywają tyle samo energii 🚰

Utrwalony jest mit, że „chłodzenie powietrzem nie zużywa wody”. Nie do końca. Systemy o dużym zapotrzebowaniu na powietrze często wymagają więcej energii elektrycznej , która w wielu regionach odprowadza wodę z sieci; z drugiej strony, chłodzenie wodne może obniżyć zużycie energii i emisję spalin kosztem wody na miejscu. Duzi operatorzy wyraźnie równoważą te kompromisy w poszczególnych lokalizacjach [1][5].


Głęboka analiza: szybka weryfikacja rzeczywistości w kontekście wirusowych twierdzeń 🧪

Być może widziałeś śmiałe stwierdzenia, że ​​pojedyncza podpowiedź równa się „butelce wody” lub, z drugiej strony, „tylko kilku kroplom”. Lepsza postawa: pokora z matematyką . Dzisiejsze wiarygodne ograniczenia to ~0,26 ml dla mediany podpowiedzi produkcyjnej z pełnym narzutem serwowania [1] i ~45 ml dla odpowiedzi asystenta za 400 tokenów (wnioskowanie marginalne) [2]. Często udostępniane „jednej piętnastej łyżeczki” nie ma publicznej granicy/metody; traktuj je jak prognozę pogody bez miasta [1][3].


Mini-FAQ: Ile wody zużywa sztuczna inteligencja? Jeszcze raz, prostym językiem 🗣️

  • Co więc powinienem powiedzieć na spotkaniu?
    „Według podpowiedzi, waha się od kropli do kilku łyków , w zależności od modelu, długości i miejsca, w którym jest prowadzony. Trening odbywa się w kałużach , a nie w kałużach”. Następnie podaj jeden lub dwa przykłady z powyższej listy.

  • Czy sztuczna inteligencja jest wyjątkowo zła?
    Jest wyjątkowo skoncentrowana : układy o dużej mocy upakowane razem generują duże obciążenia chłodnicze. Jednak centra danych to również miejsca, w których technologie o najwyższej wydajności zwykle trafiają jako pierwsze [1][4].

  • A co, jeśli po prostu przeniesiemy wszystko do chłodzenia powietrzem?
    Można ograniczyć na miejscu , ale zwiększyć zużycie poza miejscem, wykorzystując energię elektryczną. Doświadczeni operatorzy biorą pod uwagę oba te czynniki [1][5].

  • A co z technologią przyszłości?
    Projekty, które unikają chłodzenia wodą na dużą skalę, byłyby przełomem dla zakresu 1. Niektórzy operatorzy podążają tą drogą; energia elektryczna w górnym biegu rzeki nadal przekazuje sygnał wodny, dopóki nie zmienią się sieci [4].


Uwagi końcowe – za długie, nie przeczytałem 🌊

  • W zależności od modelu, długości monitu i miejsca jego uruchomienia, można rozważyć wartości od submililitrów do dziesiątek mililitrów monitu wynosi ~0,26 ml na jednym głównym stosie; ~45 ml dla odpowiedzi na 400 tokenów na innym stosie [1][2].

  • Szkolenie: miliony litrów dla modeli granicznych, co sprawia, że ​​harmonogram, lokalizacja i technologia chłodzenia mają kluczowe znaczenie [3].

  • Co zrobić: stosować modele o odpowiedniej wielkości, wybierać obszary, w których woda jest oszczędna, przenosić ciężkie prace na chłodniejsze godziny, preferować dostawców, którzy dostarczają projekty o niskiej zawartości wody, i wymagać przejrzystych granic [1][3][4][5].

Nieco chybiona metafora na koniec: sztuczna inteligencja to spragniona orkiestra – melodia to obliczenia, ale perkusja to chłodzenie i woda z siatki. Nastrój zespół, a publiczność i tak usłyszy muzykę, bez włączania zraszaczy. 🎻💦


Odniesienia

  1. Blog Google Cloud – Ile energii zużywa sztuczna inteligencja Google? Zrobiliśmy obliczenia (metodologia + ~0,26 ml , narzut na pełną porcję). Link
    (Artykuł techniczny w formacie PDF: Pomiar wpływu na środowisko dostarczania sztucznej inteligencji w skali Google ). Link

  2. Mistral AI – Nasz wkład w globalny standard środowiskowy dla sztucznej inteligencji (LCA z ADEME/Carbone 4; ~281 000 m³ + wczesne wykorzystanie; ~45 ml na 400 tokenów , wnioskowanie marginalne). Link

  3. Li i in. - Uczynienie sztucznej inteligencji mniej „spragnioną”: odkrywanie i rozwiązywanie ukrytego śladu wodnego modeli sztucznej inteligencji (szkolenie milionów litrów , uwzględniające czas i miejsce , odstawianie a spożycie). Link

  4. Microsoft — Centra danych nowej generacji nie zużywają wody do chłodzenia (projekty z bezpośrednim chłodzeniem układu scalonego zakładają chłodzenie bez użycia wody w niektórych lokalizacjach). Link

  5. Centra danych Google — działanie w sposób zrównoważony (kompromisy w zakresie chłodzenia w poszczególnych lokalizacjach; raportowanie i ponowne wykorzystanie, w tym odzyskana woda/szarej wody; typowe codzienne zużycie na poziomie lokalizacji w rzędach wielkości). Link

Znajdź najnowszą sztuczną inteligencję w oficjalnym sklepie z asystentami AI

O nas

Powrót do bloga