W dzisiejszym świecie Kompresja bezstratna stał się stałym tematem rozmów. W miarę rozwoju społeczeństwa znaczenie Kompresja bezstratna staje się coraz bardziej widoczne w różnych aspektach życia codziennego. Wykazano, że od miejsca pracy po życie osobiste Kompresja bezstratna ma znaczący wpływ na sposób, w jaki ludzie wchodzą w interakcje ze sobą i przebieg różnych sytuacji. Przez lata Kompresja bezstratna wywołał debatę i refleksję i okazał się istotnym tematem w obecnym kontekście. W tym artykule przyjrzymy się różnym perspektywom Kompresja bezstratna i przeanalizujemy jego wpływ na różne obszary współczesnego życia.
Kompresja bezstratna (ang. lossless compression) – metoda kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, gwarantująca możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej.
Najważniejszym twierdzeniem o kompresji bezstratnej jest twierdzenie o zliczaniu.
Niemożliwe jest skonstruowanie funkcji, przekształcającej odwracalnie każdą informację na informację (czyli funkcji kompresji bezstratnej), która nie wydłuża jakiejś informacji o przynajmniej 1 bit, chyba że nie kompresuje ona żadnej informacji.
Dowód:
Załóżmy, że dana funkcja kompresuje choć jedną wiadomość do długości N bitów z dowolnej większej długości.
Jest X wiadomości o długości nie większej od N bitów.
Jeśli żadna z wiadomości zawierających nie więcej niż N bitów nie została wydłużona, to w wyniku otrzymujemy przynajmniej X+1 wiadomości o długości nie większej niż N bitów.
Ponieważ X jest skończone, to X+1>X, a więc jest to sprzeczne z założeniem, że takich wiadomości jest X. Co należało udowodnić.
Skonstruowanie funkcji, która wydłuża o nie więcej niż 1 bit, jest trywialne. Dla dowolnej funkcji f(x), niech f′(x) będzie:
Algorytmy kompresji bezstratnej dobrze kompresują „typowe” dane, czyli takie w których występuje znaczna nadmiarowość informacji (redundancja).
Pewne rodzaje danych są bardzo trudne lub niemożliwe do skompresowania:
Najczęściej używane metody kompresji bezstratnej można podzielić na słownikowe i statystyczne, choć wiele metod lokuje się pośrodku: