Locked History Actions

Diff for "ImportM4"

Differences between revisions 1 and 9 (spanning 8 versions)
Revision 1 as of 2009-09-04 09:09:22
Size: 660
Comment:
Revision 9 as of 2009-09-04 10:14:27
Size: 5141
Comment:
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
= Konverteringsstatus =

Konverteringen har afsløret nogen problemer i samspillet mellem VMware (at vi bruger virtuelle servere, hvor flere servere deler fysiske servere). Det har medført at nogle af import jobbene er fejlet uden rimelig grund, og først ved gennemgang af logfilerne er det blevet afsløret, og de er kørt om.

Problemet er forhåbentlig nu afhjulpet.
= Import af poster til M4 =
Line 8: Line 4:

For de meget interesserede kan alle data- og logfiler ses [http://rastaban:30080/milestone/m4/ her]
Line 12: Line 10:
{{{
Jeg har konverteret data fra Eriks dump med dato 2009-08-31.

Jeg har lagt resultatet i en zip-fil her:

O/dorete/konvertering/total.out.2009-08-31.zip

Jeg har vedhæftet logfilen fra kørslen. De fejl, de har med NOBELF burde
have været ordnet, men et eller andet er åbenbart gået galt med den fil
jeg læser konverteringskoderne fra. Det kommer på plads til næste
kørsel.

Derudover er der 87 fejl pga. sorteringstegn, som så vidt jeg er husker
skal løses i horizon.
}}}

Da jeg kikkede loggen igennem noterede jeg mig
{{{
Der er ca 200 linier som omhandler delfelt 5 problemer, såsom:
2009-09-02 10:00:48,812 [main] WARN dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning OWN code UFEJL.
2009-09-02 10:00:48,812 [main] WARN dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning empty string as subfield 5.
2009-09-02 10:00:48,812 [main] WARN dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning value of subfield 5 as subfield 6.

En enkelt linie har et problem med Aleph escape code i et 909 *a
}}}

Der var ikke nogen yderligere kommentarer i logfilerne fra Aleph.
== Eksemplarposterne ==
Bjørn havde følgende bemærkninger til posterne:
{{{
3364615 poster læst
57806 skippet da eksemplarenre tilhører filialer, der ikke skal konverteres
47 poster kunne ikke konverteres på grund af fejl i eksemplar data,
f.eks ugyldige filial og samlings kombinationer
}}}
Importen til Aleph gav anledning til en del fejl af følgende typer:
{{{
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000300
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000301
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000376
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000380
0208 : conflict between Z30-SUB-LIBRARY and Z30-ITEM-STATUS
%Errors found for record in line 000000395
0208 : conflict between Z30-SUB-LIBRARY and Z30-ITEM-STATUS
%Errors found for record in line 000000396
}}}
== Lån ==
Bjørn gav følgende kommentar med:
{{{
112490 poster læst
1 post skippet da filialen ikke skal konverteres
6 poster droppet på grund af fejl, dvs 3 lån på ikke eksisterende
eksemplarer og 3 lån på materialer i ugyldig tilstand.
}}}
Der var ingen kommentarer fra Aleph ved importen, udover
{{{
Start check/correct of records...
Program is not exists: correct_z36
}}}
== Reservationer ==
Bjørns kommentar:
{{{
13221 poster læst
11544 poster skrevet
1677 poster filtreret fra på grund af deres type/status eller ugyldige afhentningssteder.
}}}
Importen til Aleph gav et antal kommentarer af typen
{{{
0202 : Z37-PICKUP-LOCATION is not valid
%Errors found for record in line 000000014
}}}
Der er også et antal fejl som
{{{
02:36:34 Error (get_buf_z30_like) : io_z30.read for "SOL50.z30.003529483000010" failed
}}}
De kan muligvis skyldes de førstnævnte problemer med importer der fejlede, som kan have givet anledning til manglende poster på det tidspunkt hvor bestillingerne blev lagt ind. Det skal afgøres ved en omkørsel.
== Copy-poster med tilhørende items ==
Aleph importen af copy-poster gav en del fejl, såsom
{{{
0210 : Invalid Collection
%Errors found for record in line 000000009
0210 : Invalid Collection
%Errors found for record in line 000000010
0210 : Invalid Collection
%Errors found for record in line 000000014
0210 : Invalid Collection
%Errors found for record in line 000000031
0210 : Invalid Collection
%Errors found for record in line 000000033
0208 : conflict between Z16-SUB-LIBRARY and Z16-ITEM-STATUS (check tab15)
%Errors found for record in line 000000072
0207 : Z16-CLAIM-2 (-3, -4) can not be empty when Z16-CLAIM is "Y"
%Errors found for record in line 000000103
}}}
De tilhørende copyissue og copyitem poster gav følgende typer af fejl:
{{{
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000071
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000072
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000073
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000074
}}}
== Vendor poster ==
Importen ef vendor (SOL50 z70 og z72) poster gav klager som
{{{
0201 : Z70-CURRENCY-1 is not correct
%Errors found for record in line 000000001
0201 : Z70-CURRENCY-1 is not correct
%Errors found for record in line 000000002
}}}
hvilket skyldes at vi manglede z82 tabeller der definerer møntfødder. De er siden lavet i hånden.

Import af poster til M4

I første omgang ser det ud til, at hvis importerne køres med p_file_04 (import af tabeller uden check) kan importen gennemføres på et par timer ... dertil kommer så indekseringen.

For de meget interesserede kan alle data- og logfiler ses [http://rastaban:30080/milestone/m4/ her]

Bibliografiske poster

Fra Mads kom der følgende kommentar da han afleverede data:

Jeg har konverteret data fra Eriks dump med dato 2009-08-31.

Jeg har lagt resultatet i en zip-fil her:

O/dorete/konvertering/total.out.2009-08-31.zip

Jeg har vedhæftet logfilen fra kørslen. De fejl, de har med NOBELF burde
have været ordnet, men et eller andet er åbenbart gået galt med den fil
jeg læser konverteringskoderne fra. Det kommer på plads til næste
kørsel.

Derudover er der 87 fejl pga. sorteringstegn, som så vidt jeg er husker
skal løses i horizon.

Da jeg kikkede loggen igennem noterede jeg mig

Der er ca 200 linier som omhandler delfelt 5 problemer, såsom:
2009-09-02 10:00:48,812 [main] WARN  dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning OWN code UFEJL.
2009-09-02 10:00:48,812 [main] WARN  dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning empty string as subfield 5.
2009-09-02 10:00:48,812 [main] WARN  dk.statsbiblioteket.alephimportexport.marc.
HOLConvert - Error looking up subfield 5 value: SV. Returning value of subfield 5 as subfield 6.

En enkelt linie har et problem med Aleph escape code i et 909 *a

Der var ikke nogen yderligere kommentarer i logfilerne fra Aleph.

Eksemplarposterne

Bjørn havde følgende bemærkninger til posterne:

3364615 poster læst
57806 skippet da eksemplarenre tilhører filialer, der ikke skal konverteres
47 poster kunne ikke konverteres på grund af fejl i eksemplar data,
f.eks ugyldige filial og samlings kombinationer

Importen til Aleph gav anledning til en del fejl af følgende typer:

0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000300
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000301
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000376
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000380
0208 : conflict between Z30-SUB-LIBRARY and Z30-ITEM-STATUS
%Errors found for record in line 000000395
0208 : conflict between Z30-SUB-LIBRARY and Z30-ITEM-STATUS
%Errors found for record in line 000000396

Lån

Bjørn gav følgende kommentar med:

112490 poster læst
1 post skippet da filialen ikke skal konverteres
6 poster droppet på grund af fejl, dvs 3 lån på ikke eksisterende
eksemplarer og 3 lån på materialer i ugyldig tilstand.

Der var ingen kommentarer fra Aleph ved importen, udover

Start check/correct of records...
Program is not exists: correct_z36

Reservationer

Bjørns kommentar:

13221 poster læst
11544 poster skrevet
1677 poster filtreret fra på grund af deres type/status eller ugyldige afhentningssteder.

Importen til Aleph gav et antal kommentarer af typen

0202 : Z37-PICKUP-LOCATION is not valid
%Errors found for record in line 000000014

Der er også et antal fejl som

02:36:34 Error (get_buf_z30_like) : io_z30.read for "SOL50.z30.003529483000010" failed

De kan muligvis skyldes de førstnævnte problemer med importer der fejlede, som kan have givet anledning til manglende poster på det tidspunkt hvor bestillingerne blev lagt ind. Det skal afgøres ved en omkørsel.

Copy-poster med tilhørende items

Aleph importen af copy-poster gav en del fejl, såsom

0210 : Invalid Collection
%Errors found for record in line 000000009
0210 : Invalid Collection
%Errors found for record in line 000000010
0210 : Invalid Collection
%Errors found for record in line 000000014
0210 : Invalid Collection
%Errors found for record in line 000000031
0210 : Invalid Collection
%Errors found for record in line 000000033
0208 : conflict between Z16-SUB-LIBRARY and Z16-ITEM-STATUS (check tab15)
%Errors found for record in line 000000072
0207 : Z16-CLAIM-2 (-3, -4) can not be empty when Z16-CLAIM  is "Y"
%Errors found for record in line 000000103

De tilhørende copyissue og copyitem poster gav følgende typer af fejl:

0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000071
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000072
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000073
0206 : Z30-COLLECTION is not valid
%Errors found for record in line 000000074

Vendor poster

Importen ef vendor (SOL50 z70 og z72) poster gav klager som

0201 : Z70-CURRENCY-1 is not correct
%Errors found for record in line 000000001
0201 : Z70-CURRENCY-1 is not correct
%Errors found for record in line 000000002

hvilket skyldes at vi manglede z82 tabeller der definerer møntfødder. De er siden lavet i hånden.