Jak zbudowana jest ta witryna
Krótka metryczka: jak złożony jest vodfetch i dlaczego został zbudowany tak, by mogli go czytać zarówno ludzie, jak i maszyny.
Dlaczego czyta się to właśnie tak
Coraz częściej „czytelnikami” witryny są maszyny — roboty wyszukiwarek, silniki odpowiedzi i asystenci AI. vodfetch traktuje je jako pełnoprawną publiczność, a nie coś dodanego na końcu, nigdy przy tym niczego nie ukrywając przed ludźmi: dokładnie ta sama treść serwowana jest jednym i drugim.
To nie jest chwyt marketingowy doklejony później; tak właśnie ta witryna jest zbudowana od podstaw.
Prosta z założenia
Każda strona to statyczny HTML renderowany po stronie serwera. Nie ma ściany logowania, bramki na pliki cookie ani wymogu JavaScriptu do przeczytania treści — sam downloader korzysta z JavaScriptu, ale słowa, fakty i odnośniki mieszczą się w HTML-u.
Używamy wyłącznie czcionek systemowych, więc nie ma żadnych zewnętrznych żądań o czcionki ani niczego, co blokowałoby renderowanie między Tobą a stroną.
Dwa formaty dla każdej strony
Dopisz „.md” do adresu dowolnej strony, aby uzyskać jej czystą wersję w Markdown. Czytelne dla maszyn streszczenia całej witryny znajdują się pod /llms.txt i /llms-full.txt (dla każdego języka), fakty strukturalne pod /facts.json, a kanoniczny opis encji pod /grounding.json, zgodnie ze standardem Grounding Page Standard.
Nic tam nie jest ukryte ani zamaskowane: Markdown i JSON po prostu powtarzają, w formie przyjaznej maszynom, dokładnie to, co mówi HTML.
Uporządkowana pod kątem znaczenia
Każda strona HTML zawiera jeden graf JSON-LD @graph — SoftwareApplication, FAQPage, HowTo, BlogPosting, BreadcrumbList — ze stabilnymi @id, dzięki czemu relacje między encjami a stronami są jawne, a nie zgadywane.
Pełna mapa witryny XML wymienia każdą stronę, a znaczniki hreflang łączą wszystkie czternaście wersji językowych każdej z nich.
Otwarta i weryfikowalna
vodfetch jest open source na licencji MIT w serwisie GitHub, więc działanie narzędzia da się zweryfikować, a nie jest ono czarną skrzynką. Standardy redakcyjne stojące za tymi słowami również są spisane — patrz Zasady redakcyjne i uczciwości.
Krótko mówiąc: czytelne dla człowieka i czytelne dla maszyn to tutaj jedno i to samo — czysty HTML, żadnych bramek, każda strona odwzorowana w Markdown i opisana w JSON, a wszystko to możliwe do zaindeksowania i sprawdzenia.
Powiązane strony
Pobierz swój film z Twitcha już teraz
Wklej link z Twitcha i zapisz go jako MP4 w kilka sekund — za darmo, bez konta.
Otwórz Twitch Downloader