Dokumentkonvertering

Att konvertera ett eller flera dokument från ett format till ett annat kan vara enkelt eller hur komplicerat som helst. Det är vanligt att olika format ska konverteras till XML eller något annat strukturerat format. Det kan också handla om att dokumentationen måste anpassas för att uppfylla en viss standard, exempelvis S1000D. 

Formaten är sällan ett problem, däremot hur dokumenten är skrivna. Säg att vi går från Microsoft Word till XML med DITA som målformat. I många fall kan vi spara om Word-dokumenten i ett taggat format och sedan skapa några skript som hjälper oss över till DITA-taggning. Ofta är dock originaldokumenten skrivna på ett sätt som skapar problem. DITA bygger på fristående topics som länkas ihop efter behov. Originaldokumenten däremot är oftast skapade som just dokument, med löptext och kapitel och har alltså ett helt annat upplägg. I dessa fall behöver informationen både struktureras om och skrivas om för att få ett bra slutresultat. Det arbetet görs bäst som ett separat projekt, skilt från själva konverteringen.

Bild

Det är inte bara texter som ska konverteras. Ibland behövs formatkonverteringar av bilder också. Något av det mest tidskrävande att konvertera är när någon i olika program, till exempel Word och InDesign, lagt på pilar och texter som inte ligger i själva bilden. Det tar också en hel del tid att lösa ut text ur bilder och lägga det utanför för att minska kostnader runt översättning, men det är ofta en långsiktig vinst att göra det arbetet.

Generellt rekommenderar vi inte att använda text i bilder, men det finns tillfällen då detta kan behövas. Det kan vara till exempel skärmdumpar från en mjukvara. I dessa fall är det bästa valet SVG (Scalable Vector Graphics), som är ett XML-format för bild. Med det formatet kan man översätta bilder på samma sätt som vilket XML-dokument som helst. Det är dock viktigt att kontrollera hur bilderna blir efter översättning, då texter kan svälla eller minska vid översättning till ett annat språk.

Format

Ibland finns det ett behov av att gå ifrån ett format till ett annat, oavsett om det gäller dokumentation eller bilder. Olika filformat mellan system kan göra att information behöver migreras över. Information kan också ha skapats i gamla versioner av ett program, så att filerna inte längre går att öppna i en modernare version av programmet, eller tvärtom. Alla typer av format har sina egna problem och lösningar. Vi rekommenderar att inför en konvertering alltid undersöka vilka specialprogram för formatkonvertering som finns på nätet. Det finns ofta open source eller liknande $100-program att köpa och ladda ner, som löser 80-90% av konverteringen. Våga testa!

Konverteringsprocessen

1. Analysfas

Genomgång med kund vilka dokument som ska konverteras. Det kan vara ett värde i att spara vissa dokument i originalformaten, då kostnaden för en konvertering kanske inte är befogad om dessa dokument sällan kommer att uppdateras.

Analys av dokumentens komplexitet samt tillvägagångssätt. Är det mest effektivt att utveckla skript som kan göra en del av konverteringen, eller är handkonvertering (klipp och klistra) det bästa? Här görs en uppskattning av hur mycket tid respektive metod kräver i det aktuella fallet. Typen av innehåll i originalmaterialet har stor påverkan här. Tabeller tar exempelvis betydligt längre tid att konvertera än vanlig löptext.

2. Struktureringsfas

Utredning om omstrukturering av vissa dokument behövs för att anpassa dem till målformatet. Om omstrukturering behövs utreder man även om det är bäst att göra detta före eller efter konverteringen. 

Målsättningen är alltid en så kallad ett-till-ett konvertering, då det är svårt att kontrollera och granska att konverteringen är genomförd på rätt sätt om inte det är samma data på bägge sidor. Lägger man till ändringar av olika slag blir granskningen extremt komplex, därför rekommenderar vi alltid att försöka hålla isär ändringar och konvertering. Omstrukturering är alltså ett komplicerande inslag i en konvertering.

3. Konverteringsfas

Genomförande av konverteringen. Oftast använder vi kundanpassade skript för att konvertera den stora massan av data. Ambitionen är att använda 80/20-modellen. Det innebär att vi försöker konvertera 80% av all data med skript, resten handkonverterar vi. Det blir också en viktig kvalitetskontroll att granska materialet med mänskliga ögon.

  • Konvertera informationen ett-till-ett, alltså utan att göra några ändringar i innehållet. Eventuella ändringar och förbättringar görs efteråt, som ett eget projekt. På så vis går det att kontrollera och säkerställa att konverteringen är korrekt och att allt har kommit med.
  • Kom ihåg att konvertering bara handlar om formatet. Om det som är skrivet inte håller riktigt bra klass i det gamla formatet så hjälper det inte med bara ett nytt format. Den kvalitet som stoppas in är också den kvalitet som kommer ut, så om ni funderar på att investera i en konvertering, tänk först igenom vad ni kan förbättra text-, bild- och strukturmässigt. Här finns det mycket pengar att spara.