Am nevoie de programatori și, eventual, webdesigneri
Voluntari, desigur, la fel ca și mine. E vorba de un proiect despre care puteți afla tot ce vă trebuie să știți de mai jos. Dacă se înscrie cineva, să-mi scrie. Mulțumesc!
Public records database
register for this team at: http://thesponge.eu/entry-list/6
register for the hackathon at: www.openmediachallenge.eventbrite.com
nevoi:
– programere: scrapping baze de date online mentionate in propunere
– programare: robot scrapp chestii noi care apar
– programare: indexare date pe model monitorul-oficial.org (pentru cautare) si posibilitate de download tot sau cross-cautare in index-uri pe fiecare baza de date in parte
– design / functionalitate / tutorial
send questions about the project at: catalin.prisacariu@gmail.com
Open Media Challenge – hack cu noi!
Open Media Challenge (OMC) este un eveniment co-finantat de Knight-Mozilla Open News. Evenimentul este initiat de Laboratorul de Inovatie Media – Sponge si este organizat de CRJI,geo-spatial.org, Ceata, ROSEdu si ApTI.
Programatori, graficieni, jurnalisti, activisti si studenti cu spirit de echipa si pasionati de date deschise colaboreaza in cadrul unui hacaton pe 29-30 Septembrie. Hack cu noi si inregistreaza-te aici pentru eveniment si aici alege-ti o echipa sau inscrie-te pe lista comuna!
Un juriu international va decide care este cea mai buna aplicatie rezultata din acest efort colaborativ. Printre altii, Stephen King, partener in cadrul Omidyar, va fi prezent la Bucuresti ca parte din acest juriu. Invitat special si participant din partea Mozilla va fi Laurian Gridinoc.
OMC faciliteaza scrierea de cod, avand ca rezultat programe libere, care raspund la probleme reale legate de media, in special referitoare la agregari si vizualizari de date. OMC este un efort colaborativ, axat pe colectia si distributia de informatie in Estul Europei si se va desfasura in limba engleza.
Hacatonul are loc in ultimul weekend al lunii septembrie la Bucuresti si consta in: o zi dedicata hăcuitului si alta dedicata revizuitului de cod și a propunerilor lucrate, jurizarea aplicatilor si o petrecere de după. Mai multe informatii legate de acest eveniment gasesti la www.thesponge.eu. Daca vrei sa participi inscrie-te aici.
Daca vrei sa sponsorizezi acest eveniment (exemple de posibile sponsorizari: wifi, catering, premii), scrie la omc@thesponge.eu.
Pe viitor, intentionam sa continuam dezvoltarea proiectelor incepute la OMC si sa deschidem un hack-space colaborativ.
10 Comments
nu merge monitorul-oficial.org
Catalin, vezi ca:
1. http://www.co.romarhiva.ro are captcha, ceea ce face scraping-ul f dificil (sa nu zic imposibil)
2. http://www.kurtyan.org/MOF desi sunt pdf-uri, sunt de fapt documente scanate puse in PDF-uri. La fel e si http://declaratii.integritate.eu/home/navigare/cautare-avansata.aspx. Pentru astea, o sa fie destul de greu sa scoti text-ul, iti trebuie un program OCR, care iti poate da datele cu o acuratete de 50-80%
3. din cate stiu ONRC nu are datele firmelor publice, ci sunt accesibile contra cost.
Mult succes cu proiectul!
multumesc
Are dreptate Raul cu captcha si faptul ca declaratiile de avere sunt PDF-uri obtinute in urma scanarii unor documente, deci o sa fie greu sa extragi acele informatii automat. Am impresia ca anul asta s-au introdus sisteme electronice pentru declaratiile de avere in unele institutii (deci nu mai completezi de mana o foie, ci un formular pe intranet), asa ca probabil in viitor vor aparea pe site-ul ANI declaratii din care vei putea extrage usor informatiile despre avere.
Oricum, mult succes.
multam
Inregistreaza cineva ce o sa se intample acolo? Cine nu ajunge si vrea sa il vada si sa il auda cumva pe Stephen King…
multam
Am rezolvat parte din problema cu captcha de la http://www.co.romarhiva.ro/, adica am o bucata de cod in python care returneaza codul din imagine aproape bine (adica bine in multe din cazuri). Daca se apuca cineva de crawlat site-ul asta si vrea un punct de plecare, pot sa il dau.
multumesc mult!
salut Puthre…mai ai cumva la indemana codul in python pentru returnarea codului ?