Dokumentkonvertering

Konvertering av information från ett format till ett annat uppstår i många fall då informationsmängden ökar. Det kan också handla om att anpassa inkommande informationsmaterial i ett redan befintligt system, eller att få kontroll över återkommande information så att den håller samma struktur. Vi delar in konvertering i tre faser: analys, strukturering och genomförande.

På Condesign Devarion har vi en av landets främsta experter inom konvertering, med djup kompetens från många varierande uppdrag. En konvertering kan handla om att analysera befintligt material inför upphandling av nya verktyg och föreslå nya verktyg, men det kan också handla om att genomföra en konvertering med kundanpassade skript.

Analys

Att konvertera dokument från ett format till ett annat kan vara mycket enkelt eller hur komplicerat som helst. Det är vanligt att olika format ska konverteras till XML eller ett liknande strukturerat format. Det kan också handla om att dokumentationen måste anpassas för att uppfylla en viss standard, exempelvis S1000D.

Olika filformat mellan system kan också göra att information behöver migreras över. Information kan även ha skapats i gamla versioner av ett program, så att filerna inte längre går att öppna i en modernare version av programmet. Alla typer av format har sina egna problem och lösningar.

Under analysen beslutas vilka dokument som ska konverteras. Det kan finnas ett värde i att spara vissa dokument i originalformaten då konverteringskostnaden kanske inte är befogad om dessa dokument sällan kommer att uppdateras. Dokumentens komplexitet avgör tillvägagångssätt. Att utveckla skript som kan göra en stor del av konverteringen, eller göra konverteringen för hand. Analysen uppskattar hur mycket tid respektive metod kräver. Typen av innehåll i originalmaterialet har stor påverkan. Tabeller tar exempelvis betydligt längre tid att konvertera än vanlig löptext.

Det är inte bara texter som kan konverteras, ibland behövs formatkonverteringar av bilder också. Något av det mest tidskrävande att konvertera är när någon i olika program, till exempel Word och InDesign, lagt på pilar och texter som inte ligger i själva bilden.

Inför en konvertering är det alltid meningsfullt att undersöka vilka specialprogram för formatkonvertering som finns. Det finns ofta open source eller liknande $100-program att köpa och ladda ner, som löser 80-90% av konverteringen.

Strukturering

Utredning om omstrukturering av vissa dokument behövs för att anpassa dem till målformatet. Formaten är sällan ett problem i sig, däremot kan hur dokumenten är skrivna vara det. Exempelvis om vi ska konvertera från Microsoft Word till XML med DITA som målformat. I många fall går det att relativt enkelt spara om Word-dokumenten i ett taggat XML-dokument och sedan skapa ett antal skript som hjälper oss över till DITA-taggning. Dock finns i dom flesta konverteringar problem med att originaldokumenten oftast är skapade som just dokument, med löptext och kapitel och därmed har ett helt annat upplägg än DITA som bygger på fristående topics som länkas ihop efter behov. I dessa fall behöver informationen både struktureras om och skrivas om för att få ett bra slutresultat. Om omstrukturering behövs utreder man även om det är bäst att göra detta före eller efter konverteringen.

Det tar också en hel del tid att lösa ut text ur bilder och lägga det utanför för att minska kostnader runt översättning, men det är ofta en långsiktig vinst att göra det arbetet. Generellt rekommenderar vi inte att använda text i bilder, men det finns tillfällen då detta kan behövas. Det kan vara till exempel skärmdumpar från en mjukvara. I dessa fall är det bästa valet SVG (Scalable Vector Graphics), som är ett XML-format för bild.

Målsättningen är alltid en så kallad ett-till-ett konvertering, då det är svårt att kontrollera och granska att konverteringen är genomförd på rätt sätt om inte det är samma data på båda sidor. Lägger man till ändringar av olika slag blir granskningen extremt komplex, därför rekommenderar vi alltid att försöka hålla isär ändringar och konvertering. Omstrukturering är ett komplicerande inslag i en konvertering och ofta rekommenderar vi att det arbetet görs som ett separat projekt, skilt från själva konverteringen i sig.

Genomförande

Oftast använder vi kundanpassade skript för att konvertera en stor massa av data. Ambitionen är att använda 80/20-modellen. Det innebär att vi försöker konvertera 80% av all data med skript, resten konverterar vi för hand. Det blir också en viktig kvalitetskontroll att granska materialet med mänskliga ögon.

  • Konvertera informationen ett-till-ett, alltså utan att göra några ändringar i innehållet. Eventuella ändringar och förbättringar görs efteråt, som ett eget projekt. På så vis går det att kontrollera och säkerställa att konverteringen är korrekt och att allt har kommit med.
  • Kom ihåg att konvertering bara handlar om formatet. Om det som är skrivet inte håller riktigt bra klass i det gamla formatet så hjälper det inte med bara ett nytt format. Den kvalitet som stoppas in är också den kvalitet som kommer ut, så om ni funderar på att investera i en konvertering, tänk först igenom vad ni kan förbättra text-, bild- och strukturmässigt. Här finns det mycket pengar att spara.