- Created by Hanečák Peter, last modified on Apr 08, 2019
V spolupráci so SOIT sme nadviazali na Open Scraper Challenge 2011 (http://www.soit.sk/sk/odborne-sekcie/gov/2011-10-26/149-report-z-open-scraper-challenge-2011) a pokračujeme vo vývoji nových scraperov ako aj v udržiavaní starších, existujúcich. Cieľom je odstraňovať mreže uväzneným dátam a poukázať na to, že zverejňovať údaje bez možnosti si ich stiahnuť je kontraproduktívne.
Kto má záujem pomôcť oslobodiť zatiaľ ťažko dostupné údaje, preňho sú určené časti "Scrapre ktoré ešte chceme sprevádzkovať" a "Čo môžem robiť hneď?". Kto by rád prispel aspoň drobnými úpravami ale pre tých, čo hľadajú už oslobodené údaje, pre tých je sekcia "Existujúce scrapre":
Open Scraper Challenge 2017: október 2017, http://ossvikend.sk/osc2017.html
Možno spojiť s účasťou na Hacktoberfest.
Pripomienky čí návrhy možno posielať či už cez túto Wiki, GitHub alebo mailom na scrapers@soit.sk .
Existujúce scrapre
Vrámci Open Scraper Challenge koncentrujeme všetky sprevádzkované alebo rozpracované scrapre na Morph.io, pod hlavičkou SOIT:
Podrobnejšie informácie sú potom vedené v tejto Wiki stránke a jej podstránkach.
Kto hľadáte údaje, nájdete ich na Morph.io na stránke konkrétneho scrapera v časti "Data". Údaje si tam možno priamo prezerať alebo stiahnuť (ako súbor CSV alebo SQLite databázu).
Kto by rád pomohol s údržbou alebo vylepšeniami, je vhodné priebežne sledovať stav scrapra a zistené problémy hlásiť (napr. v Issue trackeri daného scrapra na GitHub-e). Kto má potom čas a znalosti, uvítame pomoc s opravami nahlásených problémov. Opravy potom možno poslať cez pull request alebo ako praobyčajný patch.
- Scraper: Agenda from Slovak government meetings
- Scraper: Avalanche statistics in SR
- Scraper: Bratislava - dohody
- Scraper: Bratislava - faktury
- Scraper: Bratislava - zmluvy
- Scraper: Brno, Sever - Adresar
- Scraper: Brno, Sever - Aktualni usneseni rady
- Scraper: Brno, Sever - Harmonogram svozu směsného komunálního odpadu
- Scraper: Brno, Sever - law 106
- Scraper: Brno, Sever - obstaravanie
- Scraper: Brno, Sever - odbory
- Scraper: Brno, Sever - Prispevkove organizace
- Scraper: Brno, Sever - Severnik
- Scraper: Brno, Sever - Spoteba vody
- Scraper: Brno, Sever - uredni deska
- Scraper: Brno, Sever - vodne a stocne
- Scraper: Brno, Sever - Vykopove prace
- Scraper: Brno - Councilor retrievals
- Scraper: CZ - traffic accidents - all
- Scraper: DIGITALNEmesto.sk
- Scraper: Evidencia nehnuteľného majetku štátu v správe riadených organizácií kapitoly MF SR
- Scraper: Excused absence requests of Slovak parliament members
- Scraper: Hasičský záchranný sbor Jihomoravského kraje - Používané zkratky
- Scraper: Hasičský záchranný sbor Jihomoravského kraje - Seznam událostí
- Scraper: MV SR - statistiky kriminality
- Scraper: NR SR - Prepisy
- Scraper: Objednávky, faktúry a zmluvy prokuratúr SR
Scraper: ORSR- Scraper: Rozhodnutia sudov SR ohladom dusevneho vlastnictva
- Scraper: SHMU Observations
- Scraper: Slovak mail service post codes
- Scraper: Static about death in Slovak mountains from Slovak mountains rescue service
- Scraper: UPV SK - patents
- Scraper: UPV SK - trademarks
- Scraper: Zoznam vyberovych konani na MS SR
Vysvetlivky:
- pri poslednej review fungoval
- sú tam nejaké menšie veci na opravu či vylepšenie
- nefunguje
Scrapre ktoré ešte chceme sprevádzkovať
Kto má záujem pomôcť oslobodiť zatiaľ ťažko dostupné údaje, môže námety čerpať v tejto sekcii:
Informácie s Challange
Open Scraper Challenge organizujeme, aby sa scrapovanie robilo ľahšie a veselšie. Tu nájdete odkazy na poznámky z jednotlivých challenge:
Foto: By Ryan G. Wilber, U.S. Navy [Public domain], via Wikimedia Commons
Čo môžem robiť hneď?
Tí, čo vedia programovať sa môžu vrámci Scraper Challange 2017 (ale aj po nej) zahryznúť napr. do implementovania niektorých nových scraprov či funkcií, alebo do opravy chýb, viď:
https://public.etherpad-mozilla.org/p/osc2017
- No labels
1 Comment
Hanečák Peter