Autor: Danijel Turina
Datum: 2010-03-09 11:09:48
Grupe: hr.soc.religija
Tema: Re: Vreme za testiranje
Linija: 57
Message-ID: hn56pc$ot1$2@ss408.t-com.hr

-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA512

Ged wrote:
> Steta. Nadao sam se da je neko otkrio jednostavan nacin da se koristi
> Googlova baza podataka.

Ma google namjerno otežava pristup zato da drugi nebi njima mogli
napraviti ono što oni rade drugima, kad recimo pokupe vijesti s drugih
sajtova i tako im kradu promet. Oni žele biti jedina točka pristupa
podacima.

> Nema potrebe dalje se truditi oko ovoga. Po rezultatima vidim da bi u
> program bilo potrebno ubaciti relativno komplikovan kod. Analiza raznih
> formata kod oznacavanja citata tudjeg teksta nije tako jednostavna, a zato
> sto vecina pise jako kratke poruke oni u svom ukupnom zbiru nemaju dovoljno
> teksta da bi statisticka analiza bila jednostavna. Trebalo bi uzeti vise
> godina unazad.

Takvo nešto sam i ja zaključio, naime bez komplicirane gramatičke
analize gdje bih riječi svodio na korijene i tako eliminirao deklinacije
i slične stvari, te eliminirao opsežne citate, ne-riječi i tipfelere, od
toga ništa. Isplatilo se probati ali jebiga.

> Steta sto nemas vecu bazu poruka. Secam se da su ranije u YU news
> hijererahiji neki ljudi jednostavno podigli svoj news server pod
> Linuxom, pa
> zatim redovno arhivirali zanimljive konferencije. Ne bi bilo lose za
> uspomenu i stare dane imati arhivu sa dokaznim materjalom:
> "Kako sam upropastio silno vreme, onda kad sam ga jos imao" :)))
> 
> Sem toga, nikad se ne zna kad moze zatrebati, za dobro ili lose.

Ma, imam ja bazu podataka sa svojim porukama, u koju svakih par minuta
skripta doda sve što se novo pojavilo na news serveru, ali ne isplati mi
se arhivirati poruke svih sudionika budući da je to rupa bez dna. Ne
želim napraviti tako veliku bazu podataka da postane prevelika za backup.

U teoriji, mogao bih se pretplatiti na nešto poput giganews i polako
povući zadnjih nekoliko godina poruka, ali morao bih imati dobar razlog
za to budući da bi to bilo logistički komplicirano. Arhivirati moje
poruke mi ima smisla, postojala je potreba za tim budući da se dosta
ljudi mučilo s googlom i fragmentiranim arhivama a zanimale su ih samo
moje poruke. Onda smo se organizirali pa su oni prikupili podatke, a ja
sam napisao kod. Arhivirati sve je nezahvalan posao. Kad si samo
zamislim da bih u bazi držao svo smeće koje su razni mrakovi ovdje
naštancali kroz godine, dođe mi zlo. Neka radije to zlo proguta zaborav.

- --
http://www.danijel.org/
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)

iEYEAREKAAYFAkuWHmsACgkQU8G6/NHezOf6iACgiQSwPka2e43z/z9sLLt4A13k
wZoAniXCVZv4wWw7ueZ5USfm0ROQ5NXG
=pLD4
-----END PGP SIGNATURE-----