Edge AI w domu: kontroluję PC przez Raspberry Pi + AI agent via Telegram
Article
Edge AI w domu: kontroluję PC przez Raspberry Pi + AI agent via Telegram
Niektórzy mają na biurku rośliny doniczkowe. Ja mam Isoldę.
Isolda to Raspberry Pi 3, które siedzi obok mojego monitora od ponad roku, zbierając kolejne zadania jak cichy, niedoceniany asystent. Na początku obsługiwała wewnętrzny digest newsów. Potem dostała integrację z Claude CLI. A teraz — teraz kontroluje moje całe stacjonarne PC przez Telegrama, i przypadki użycia stały się... niespodziewanie uroczym. I też nie do końca uroczym.
Zaraz wytłumaczę. 🙂
Pierwotny problem (nudny, ale prawdziwy)
Podróżuję. Nie egzotycznie — głównie Wrocław–gdzieś, z powrotem, powtórz. Ale często potrzebuję szybko coś poprawić na domowym PC: zrestartować serwis, sprawdzić logi, otworzyć projekt w IDE, uruchomić skrypt.
Wożenie laptopa wszędzie "na wypadek gdybym musiała SSH-ować do domowej maszyny" wydawało się przesadą. Telefon mam zawsze przy sobie. Telegram jest zawsze otwarty. Pytanie brzmiało: czy Isolda mogłaby siedzieć w domu, być zawsze włączona i działać jako pośrednik — dając mi możliwość sterowania PC przez czat na Telegramie, gdzie agent AI interpretuje moje polecenia?
Odpowiedź, jak się okazało, brzmi: tak. I zajęło to jeden weekend.
Jak to działa (krótko, bo śmieszna część dopiero przed nami)
Setup:
- Raspberry Pi 3 jest zawsze włączone, podłączone do sieci domowej
- Moje stacjonarne PC obsługuje Wake-on-LAN (WoL) — Isolda może wysłać magic packet żeby je zdalnie włączyć
- Kiedy PC jest włączony, Isolda łączy się przez SSH żeby wykonywać polecenia
- Agent AI działa na Isoldzie, nasłuchując prywatnego bota Telegram
- Wysyłam wiadomość jak "włącz PC i otwórz VS Code" — agent to interpretuje, budzi PC, łączy się przez SSH i wykonuje sekwencję
Agent używa Claude (oczywiście) żeby tłumaczyć polecenia w naturalnym języku na rzeczywiste akcje shellowe. Wie, które polecenia są bezpieczne, które wymagają potwierdzenia, a które absolutnie nie mogą zadziałać bez dwukrotnego wpisania "tak, jestem pewna."
Do interakcji z ekranem może uruchomić skrypty, które robią screenshot i odsyłają go na Telegram. Mogę dosłownie zobaczyć, co jest na moim monitorze, z dowolnego miejsca.
Bonus, którego się nie spodziewałam (ale desperacko potrzebowałam)
Z pracą z domu, kiedy ma się rodzinę, jest jeden problem: komputer to wspólne dobro.
Mój mąż jest cudowny. Jest też głęboko oddany swoim weekendowym sesjom grania. I pewnym króliczym norkom na YouTube. I w te dni, gdy mam rozmowę z klientem za 20 minut, a on jest w środku sesji w coś, czego absolutnie nie można teraz przerwać — dawniej musiałam fizycznie podchodzić, robić smutne oczy i negocjować.
Już nie.
Teraz wysyłam wiadomość do Isoldy: "wyłącz PC"
I wyłącza się. 😇
Bez konfrontacji. Bez negocjacji. Tylko ciche, zdalne, nieuniknione wymierzenie sprawiedliwości.
Funkcja screenshota ma... wiele zastosowań 📸
Zbudowałam możliwość robienia screenshotów, żeby zdalnie sprawdzać uruchomione procesy. Ale kiedy już istniała, odkryłam, że ma zastosowania rodzinne, których nie do końca przewidziałam.
Zastosowanie 1: Sprawdzanie, czy długo działający skrypt nadal działa, czy może PC się zawiesił.
Zastosowanie 2: Sprawdzanie, czy osoba aktualnie "oglądająca coś" na PC ogląda coś odpowiedniego na daną godzinę i dla danej widowni. 👀
Zastosowanie 3: I słuchajcie — Isolda ma też dostęp do kamery internetowej. Więc jeśli naprawdę chcesz wiedzieć, kto siedzi przy Twoim komputerze o 23:00... możesz to wiedzieć. 😂
Chcę zaznaczyć, że korzystam z tej władzy odpowiedzialnie. Prawie zawsze. Zdjęcie z kamery to głównie środek odstraszający — taka energia "mogłabym wiedzieć," która trzyma wszystkich w ryzach.
Co mnie zaskoczyło w tym setupie
Kilka rzeczy, których naprawdę się nie spodziewałam:
Jest szybciej niż myślałam. Od wysłania wiadomości na Telegram do działającego PC i uruchomionego skryptu mija około 45–60 sekund. WoL jest szybki, handshake SSH jest szybki, a agent nie przemyśla prostych poleceń.
Warstwa AI naprawdę ma znaczenie. Bez agenta musiałabym pamiętać dokładne komendy, ścieżki, nazwy serwisów. Z nim mogę powiedzieć "zrestartuj rzecz, która przetwarza RSS" i sam figlaruje co mam na myśli. To nie jest trywialna poprawa komfortu pracy.
Isolda jest niezwykle cierpliwa. Ani razu nie narzekała na otrzymanie wiadomości na Telegram o 2 w nocy z prośbą o sprawdzenie procesu. W przeciwieństwie do niektórych innych domowników, których nie wymienię z imienia.
Poziom paranoi jest niski. Wszystko działa w mojej sieci lokalnej lub przez SSH. Bot Telegram jest prywatny, uwierzytelniony, dostępny tylko z mojego konta. To nie jest setup "losowe osoby mogą sterować twoim PC." To jest setup "mogę sterować moim PC z dowolnego miejsca."
Czy to mogłoby być produktem?
Szczerze — tak. Wersja tego ma sens dla małych zespołów i home labów. Rdzeń jest prosty:
- Zawsze włączone urządzenie brzegowe (RPi, NUC, stary laptop)
- Agent AI do interpretacji poleceń w naturalnym języku
- Bezpieczny tunel lub SSH do dostępu do lokalnej maszyny
- Telegram (albo Slack, albo Discord) jako interfejs
Dla firm przypadek użycia jest trochę inny — pomyśl "centrum dowodzenia DevOps w kieszeni," a nie "wyłącz sesję grania męża." Ale architektura jest ta sama.
Budowaliśmy bardziej złożone wersje tego dla klientów — agenty AI zarządzające infrastrukturą, uruchamiające diagnostykę, wyzwalające deploye przez czat. To się skaluje. I zaczyna się, jak wiele dobrych rzeczy, od Raspberry Pi, którego ktoś odmawia wyrzucić.
Aktualny zakres obowiązków Isoldy
- Monitorowanie procesów: ✅
- Budzenie PC na żądanie: ✅
- Zdalne wyłączanie PC: ✅ (kontrowersyjne, ale skuteczne)
- Robienie screenshotów: ✅
- Robienie zdjęć kamerą: ✅ (rzadko używane, maksymalny efekt odstraszający)
- Ciche obserwowanie rodzinnych zwyczajów medialnych: ✅ (pasywne)
Zarabia na swój rachunek za prąd. Ledwo. Ale zarabia.
Jeśli chcesz zbudować coś podobnego — dla siebie albo jako część automatyzacji biznesowej — napisz do nas. Budujemy agenty AI, które naprawdę działają, a nie tylko rozmawiają.
No comments yet. Be the first to comment.