Ali je scrapanje strani dovoljeno?

Kaj pravite, je scrapanje oziroma samodejno poizvedovanje po določenih straneh dovoljeno?

Primer iskalnika www.gohome.si, kateri samodejno brska po vseh nepremičninskih straneh in na podlagi najdenih podatkov servira na enem portalu informacije, ki jih uporabniki iščejo o teh straneh?

Lahko torej legalno in programsko (avtomatizirano) brskaš po javno objavljenih straneh in najdene podatke serviraš uporabnikom pod določenimi iskalnimi kriteriji?

Si pa v svojo bazo ne shranjuješ nobenih konkretnih podatkov, samo URL-je od screjpanih podstrani.

Ne vem če sem bil dovolj jasen.

13 odgovorov

Če kopiraš vsebino in ne poveš od kje ti potem ja. Če pa zbiraš informacije in jih korektno podaš naprej potem je vse OK. Drugače ma google velik problem ;)

1

Jaz mislim, da predvsem obstaja težava z avtorskimi pravicami te vsebine. Če ti je lastnik dovolil, ali če so informacije javnega značaja oziroma objavljene pod licenco, ki to dovoljuje, potem ja. Drugače zna biti problem.

Sej obstaja tudi neki archive.si ali nekaj takega, stran, ki iz najrazličnejših domen enostavno pobira content in ga prikazuje na svoji strani. Seveda, dokler jim ne pošlješ maila in poveš, da tega ne smejo delat, ko ga umaknejo.

Gohome je vprašal lastnike strani, če lahko scrapa njihove strani.

Sicer kot rečeno ne bi nobene vsebine shranjevali in niti objavljali na naši strani in strežniku. Gohome sicer to počne, shranjuje in javno objavlja skrajšano vsebino screjpanih podstrani.

Sicer bi se pri nas šlo bol za servis, kot recimo skrejpanje cen določenih podstrani izdelkov in forwardiranje teh cen in urlja izdelka uporabnikom po emailu. Pri nas se shrani le cena in url podstrani, nobena konkretna vsebina.

Zna to biti sporno?

Pomoje, da ja.. v vsakem primeru gre za njihovo vsebino. Oni morajo v vsakem primeru plačati nekoga, da doda to vsebino..

Gohome vsaj v mojem primeru ni vprašal če lahko scrapa mojo stran.
Ni pa nobene panike, ker je kar nekaj prometa, ki pride iz Gohome.

mroctagon:
Gohome vsaj v mojem primeru ni vprašal če lahko scrapa mojo stran.
Ni pa nobene panike, ker je kar nekaj prometa, ki pride iz Gohome.

Večje so sigurno vprašali, če ne bi bil halo.

Določeni pogoji morajo biti izpolnjeni oz določene podatke lahko parsas...

Kateri pogoji oziroma katere podatke pa po tvojem mnenju lahko parsaš in katere recimo ne?

Objavljene cene na spletu so informacije javnega značaja in jih lahko scrapaš. Vendar prevzameš odgovornost, da so te informacije točne ali v prenesenem pomenu - če bo tvoj pajek kak dan zalutal malo po svoje in boš prikazoval napačne informacije, lahko plačaš kazen, v kolikor te odkrijejo (ponudniki, inšpekcija, konkurenca...). Zato moraš nuditi ali 100% zanesljiv servis, kar je ponavadi težko, ali pa se dogovoriti s ponudniki da ti oni providajo podatke (in s tem odgovarjajo za njih), kar je vsekakor priporočljivo.

TorcidaST:
Objavljene cene na spletu so informacije javnega značaja in jih lahko scrapaš. Vendar prevzameš odgovornost, da so te informacije točne ali v prenesenem pomenu - če bo tvoj pajek kak dan zalutal malo po svoje in boš prikazoval napačne informacije, lahko plačaš kazen, v kolikor te odkrijejo (ponudniki, inšpekcija, konkurenca...). Zato moraš nuditi ali 100% zanesljiv servis, kar je ponavadi težko, ali pa se dogovoriti s ponudniki da ti oni providajo podatke (in s tem odgovarjajo za njih), kar je vsekakor priporočljivo.

Kaj pa če imajo v terms zapisano, da ni dovoljena uporaba avtomatskih programov, botov, ...? To mislim da je kar pogosto zapisano v pogojih.