Ancient Coin Discussions In Other Languages > Forum numizmatyki antycznej po polsku

Książki, skany, OCR

(1/3) > >>

Lech Stępniewski:
Przy okazji. Zna Pan na pewno piwowską serię "Życie codzienne w...". Wiele pozycji już się trochę zestarzało, ale na ogół nadal trzymają poziom. Otóż ostatnio w czasie największych upałów, gdy nie byłem w stanie robić niczego sensownego, zająłem się przerabianiem znalezionych w sieci (zazwyczaj na chomiku) "Żyć" na poręczne pliki przeszukiwalne. Zrezygnowałem z kolorów, ilustracje są czasem mało czytelne jak ze starych gazet (ale dziś w sieci są i tak dużo lepsze obrazki), za to pliki są stosunkowo niewielkie, a OCR niezłej jakości.

Gdyby Pan coś konkretnego chciał, to proszę pytać. Może akurat mam.

DzikiZdeb:

--- Quote from: Lech Stępniewski on July 06, 2022, 07:36:59 am ---
Gdyby Pan coś konkretnego chciał, to proszę pytać. Może akurat mam.

--- End quote ---
Nie kojarzyłem, że aż tyle tego było. Wydawało mi się, że góra dwadzieścia pozycji, tymczasem widzę że było tego ponad pięćdziesiąt. A mogę być pazerny i poprosić o wszystko? Patrzyłem na tytuły i tych, do których raczej nigdy nie zajrzę jest stosunkowo mało (Kongo, Brazylia, mafia, może jeszcze kilka innych). Nie za bardzo bez dokładnego przeglądu szaf potrafię wskazać, co już mam. Skoro udało się ładnie zoptymalizować, powinno się je dać przepchnąć jedną paczką.

Lech Stępniewski:
Wszystkiego nie mam, optymalizacja nie jest doskonała, także dlatego, że materiał wyjściowy miałem czasem taki sobie. Poza tym celem nadrzędnym było uzyskanie przeszukiwalnego tekstu, żeby na przykład szybko znaleźć, co Carcopino pisze o fryzjerach.

Nie wiem, czy nie ma błędów, bo temperatura dochodziła do niemal 40 stopni, więc wyślę Panu kilka sztuk, a jeśli uzna je Pan za nadające się do użytku, będę dosyłał resztę. Także te, których nie przerabiałem.

DzikiZdeb:

--- Quote from: Lech Stępniewski on July 07, 2022, 07:55:12 am ---Wszystkiego nie mam, optymalizacja nie jest doskonała, także dlatego, że materiał wyjściowy miałem czasem taki sobie. Poza tym celem nadrzędnym było uzyskanie przeszukiwalnego tekstu, żeby na przykład szybko znaleźć, co Carcopino pisze o fryzjerach.

Nie wiem, czy nie ma błędów, bo temperatura dochodziła do niemal 40 stopni, więc wyślę Panu kilka sztuk, a jeśli uzna je Pan za nadające się do użytku, będę dosyłał resztę. Także te, których nie przerabiałem.

--- End quote ---

Jak rozumiem miał Pan pdf w zwykłych skanach i przepuszczał je przez jakieś magiczne narzędzie? Można prosić o namiar? Mam trochę przerośniętych książek, na których chętnie bym popróbował takiej operacji.

OCRy są bardzo czyste, pomyłki pojawiają się tam, gdzie były naprawdę duże paprochy - np. Carcopino, s. 29 - "jest t« oddzielny budynek" czy "której obraz wywołuje sama ntzwa". Tak więc jakby miał Pan jeszcze coś gotowego, to je chętnie przyjmę.

Lech Stępniewski:

--- Quote from: DzikiZdeb on July 08, 2022, 02:06:26 am ---Jak rozumiem miał Pan pdf w zwykłych skanach i przepuszczał je przez jakieś magiczne narzędzie?

--- End quote ---

Przepuszczam je przez FineReadera 11 w wersji portable, który działa pod XP. Jeśli wynik uznaje Pan za zadowalający, to będę sukcesywnie podsyłał resztę.

Tak przy okazji (ponieważ starałem się zachowywać metryczki etc.) patrzyłem na ceny, bo istnieje mit, że co jak co, ale książki za socjalizmu były tanie (oczywiście jeśli komuś udało się kupić ciekawą książkę w księgarni). A tu widzę, że w latach 60. średnia cena "Żyć" wynosiła jakieś 50 złotych, podczas gdy pensja ewentualnego nabywcy wynosiła wtedy ok. 2000 złotych (a na ogół mniej). Czyli raczej drożej niż taniej.

Navigation

[0] Message Index

[#] Next page

Go to full version