[Progetto ASCDB] Archivio di Stato di Cosenza - Banca dati

genpli31
male
Viestit: 47
Sukupuu: Ei-graafinen
Tarkastele heidän sukupuutaan.
Buon giorno a tutti,

Sono felice di presentare oggi il progetto "ASCDB", che dovrebbe interessare tutte le genealogiste effetuando ricerce sulla provincia di Cosenza.


Attuale stato dei Archivi di Stato du Cosenza:
- Un 'accesso unico all' indirizo : http://www.poster.beniculturali.it/ascs_web/consulta_noaut/r_semplice.faces o http://poster.beniculturali.it/poster/action.do (vecchio website)
- Uno server molto lento (le richieste sono molto molto lente perchè lo server è lente a rispondere) (*)
- È non possibile ricercare sulli tutti camppi né sulli parrecchi tipi atti
Oggi è solo possibile ricercare coi nomi/cognomi  (città e occupazione non funzionano perchè i dati vengono male indicizzati - nessun dati, nessun nomi di genitori...) quindi sono centinai o migliai dati che devono controllare "alla mano".

Oggi è questo tempo trascorso !
Il progetto ASCDB che presento è un primo passo verso la fine di questa galera.

Infatti, mi accorsi che era possibile accedere ai atti sullo vecchio website (pagine statice). In più, gli atti sono rappresentati con numeri, che sussegue.
Quindi era facile di scrivere uno script scaricando automaticamente questi dati.
Ho fissato due zone di dati :
- dal 24662 a 305385, 280 723 atti
- dal 371682 a 1171183, 799 501 atti
Sulle queste due zone, 82402 schedario non sono atti, 4564 non sono accessibile sull' Internet (errore 503) e 149 sono atti di nascita di gemelli (non gestiti)
Il numero totale di atti è : 993111 atti
- 381 844 atti di nascita
- 80 663 atti di matrimonio
- 282 245 atti di morte
- 248 359 liste di leva

Si può valutare queste perdite sullo questo schedario :
(gene_sql è lo script che esporta i dati nelli schedari sql e loro importa nello server sql)
Traduzione di qualche termine : DEBUT : inizio; FIN : fino; PERTES EFFECTIVES (sullo server): perdite effetive ; TYPE NON GERE : tippo non gestito (schedario che non è un atto); JUMEAUX : gemelli

Scaricare uno atto è molto lungo, quindi bisognòmi 1 settimana per scaricare i primi 280 723 atti (rasperry pi girando 24/24 tuttavia). Settimane di scarimento quindi...

Poi, ho scritto uno software (C++) che legge questo dato e sopratutto scrive uno schedario sql. Era molto lungo, ma sono finalmente riuscito. (Parsing HTML con gumbo lib, estrazione di dati, scrittura nello schedario sql)
Adesso, basta incaricare questi schedari su uno server SQL per avere una banca dati completa e facile a interrogare per la ricerca (a base di SQL, SELECT FROM, etc...).
Purtroppo, le mie conoscenze in PHP HTML sono vicine di 0 e non so concepire un servizio web che permettrebbe a tutti di approfittare di questi dati.
Nota : Sto lavorando su un tale sito. Ignoro se arriverò. Vi terrò al corso sul questo punto.

Posso fornire certamente gli schedari sql ai conoscitori (attenzione, comportano delle centinaie di migliaie di linee)

Adesso, così qualche conoscitore si vota per aiutare alla creazione d'un piccolo sito web che permette a tutti di accedere ai dati, che si faccia conoscere! (semplice formulario PHP + connection allo server mySQL)


Conclusione:
Il progetto ASCDB permette delle ricerche molto spinte sugli archivi di Cosenza, del meno queste che sono sullo portale di antenati. Sono riuscito a costruire una banca di dati SQL. C'è vicino ad un milione di dati indicizzati e pronte ad essere interrogare, ma non so fare uno sito web per il momento, dunque le persone non conoscendo la tecnologia SQL non possono cui avere accesso.

Aspettando, per quelli che non sa utilizzare lo SQL, (ed io pensano che sono numerosi), possono sempre formularmi le vestre domande di ricerca, che effettuerò secondo le mie disponibilità.
per fare ciò, domandate sullo forum o meglio, iscrivete le vostre domande su questo legame : https://docs.google.com/spreadsheets/d/1A1HW5jo13zoBV3Tc0Oo3dlXwmqXYqRAIC804aaGhrnI/edit?usp=sharing

Alcune catture di schermi per rendervi conto dell'avanzato di questo progetto...
https://drive.google.com/open?id=0B9BuZGLyvSeANC1fS2VzY3pybGc

Le case di nascite di gemelli non possono essere rivelati dallo software (per il momento) quindi non saranno nella banca di dati (149 case)

Problemi :
- Nessuno collegamento collo nuovo website, è impossibile di richiedi copia
Sarà correto se ho il tempo e se trovo un modo


(*) Penso, per le avere provato sulla mia banca di dati, che sia perchè ogni richiesta effetua una giuntura sulle quattro tavole della banca di dati (nascite, matrimoni, morte, liste di leva), che esse, sono molto lunge.
Liitteet
Capture7.PNG
Capture8.PNG
controle.PNG

Palaa sivulle “Italia meridionale / Isole”