Jeg har hatt stor sans for deg – Håkon Wium Lie – for ditt tidligere arbeid i W3C. Du er én av de få norske navn som har vært internasjonalt kjent. Det forplikter og krever stor grad av faglig integritet. Jeg ønsker som mange andre å være stolt av de meritter som Norge kan skilte med i en stadig voksende programvarebransje.
Du hadde en uttalelse til VG-TV onsdag 9. april som jeg synes er oppsiktsvekkende, spesielt sett i lys av vår epost-kommunikasjon i etterkant av ditt intervju med VG-TV.
Microsoft-skatt?
Du bruker eksempelet med at dersom en forelder mottar et Open XML dokument fra en lærer så må hun betale en Microsoft-skatt i form av at de må kjøpe Microsoft-programvare. Med dette sier du at ingen andre en Microsoft kan lese et Open XML-dokument, verken nåtidens eller fremtidens. Du har ikke mye tiltro til de mange utviklerne som lager programvare i vår bransje. Påstanden er dessuten feil. Det finnes allerede flere applikasjoner som åpner Open XML. Blant disse er, Open Office, NeoOffice, Apple iWork, Open XML Writer, IBM WebSphere Portal og Lotus Quickr for å nevne noen.
Empiri
Som tidligere forsker vet du at for å komme til konklusjoner med presisjon så er det viktig å samle grunndata og foreta egne analyser. I denne saken er det åpenbart at du ikke har gjort en datainnsamling, men i stedet trukket en konklusjon på politisk grunnlag. Du er ikke i nærheten av å ha faglig argumentasjon, ei heller empiri for din påstand til VG-TV.
Epost-kommunikasjon
Når jeg ber deg om å sende over noen dokumenter lagret i Open XML fra skolen til foreldre som ikke lar seg lese i et Open Source produkt som f. eks Open Office så svarer du med at dette gjelder fremtidens dokumenter. Samtidig spør du meg hvordan kan foreldrene lese et spesifikt dokument som jeg sendte deg 19. mars, dette dokumentet [1] innholder matematisk notasjon med Equation 3.0
Som svar sendte jeg deg et screenshot av dokumentet åpnet i OpenOffice. Tilsynelatende gjør du samme øvelsen og får ikke dette til å fungere. Samtidig spør du meg hvilken versjon jeg har brukt. Dokumentet er åpnet i OpenOffice 2.3 (Windows) og OpenOffice 2.4 (Linux/Ubuntu).
Det levner ingen tvil om at du har verken gjort denne øvelsen tidligere og ei vet du hvordan dette skal gjøres. Jeg følger de instrukser som er publisert på www.openoffice.org, mer komplisert er det ikke.
Faglig omdømme
Jeg har sagt det før. Det hadde styrket ditt faglige omdømme om du i fremtiden var mer faktaorientert i dine påstander. I det minste hjelper det å teste ut litt i forkant av en uttalelse.
[1] endre .doc til .docx, WordPress tillater ikke opplasting av docx
Hei Rana.
Jeg har lastet ned din fil og endret .doc til .docx, men når jeg åpner filen i OpenOffice 2.3 på Ubuntu, får jeg opp et tomt dokument.
Skal det fungere på en standard installasjon av OpenOffice, eller må jeg legge til noe?
Forøvrig forstår jeg ikke helt hva denne øvelsen skal bevise.
Med vennlig hilsen
Per Gunnar Hansø
Jeg prøvde å åpne dokumentet i:
Pages 3.0.2 – Import Error – The file format is invalid.
Word 12.0.1 - fungerer bra.
Open Office 2.4.0 – Får valg om hvilket filter jeg skal bruke – har prøvd 5 forskjellige uten å finne ut hvilken jeg skal velge.
TextEdit 1.5 – Blankt dokument
Jeg kommer til samme konklusjon som Håkon Wium Lie.
Kan du komme med instruksjoner om hvordan du åpner dokumentet, og link til disse instruksjonene som du nevner finnes på Open Office sine sider?
Hei
Ettersom du skriver så fint om innsamling av data og egne analyser; hadde jo vært på sin plass med en lenke til denne oppskriften slik at folk kunne skaffe seg sine egne empiriske erfaringer. Eneste jeg har funnet om støtte for “docx” i OOo er en utvidelse fra Novell[1], som så vidt jeg vet ikke virker i OOo under Windows.
Personlig har jeg forsøkt[2] å få OpenXML dokumentter til å virke med OpenOffice utallige ganger, uten å lykkes. Anbefalingen er og blir dermed rimelig grei; Hvis du vil at andre skal få tilgang til det du har skrevet – styr unna Open XML…
Og ja, Microsoft’s “Open” XML irriterer meg meget. Spesielt hvordan de har oppført seg for å få filformatet gjennom standardiserings-prosessen. Så beklager hvis tonen i det jeg skriver ikke er av de hyggeligste. Dog regner jeg med at du fint kan leve med det, all den tid du har betalt av Microsoft for å jobbe med dette…
[1] OpenXML/ODF Translator for OpenOffice; http://download.novell.com/Download?buildid=GuM6LMM9SR4~
[2] Som oftest har det vært en student eller foreleser som har delt et dokumenter i docx format. Selv om jeg ikke er den som har villet ha tilgang til dokumentene, er det jeg som har slitt med de ettersom jeg er den lokale “IT avdelingen”…
….jeg har testet med Ubuntu 7.10 og standard installasjonen av Open Office. Jeg kan ikke åpne dokumentet ditt Rana….Da stemmmer vel kanskje ikke alt du sier…..
….også ble jeg ennå mer interrestert og gikk inn på OpenOffice.org for å finne den berømte fremgangsmåten… En forelder vil jo i grunnen ikke vite (selv om jeg gjør det) at det som blir sendt er en OpenXML – kun at det er laget i feks MS Word….Så hvor mye skal man forvente at en forelder skal kunne/vite om IT for at vedkommende skal få lest dokumentet….Jeg synes vel ikke akkurat det var enkelt å finne det dokumentet du henviser til…..
Du kunne kanskje posta eksakt lenke til framgangsmåten du brukte for OOo for å lesa docx-fila? Prøvde det akkurat sjølv med v2.3 under Windows, og klarte ikkje utan vidare å få fram likninga i det nyopna dokumentet.
Installerte så odf-converter, sidan det var desse “instruksjonane” eg fann på openoffice.org, og opna docx-fila via denne. Då fekk eg opp eit dokument i OOo Writer som viste likninga, men dette dokumentet var altså odt-fila som converteren først hadde laga, IKKJE direkte docx-fila. Så altså, korleis fekk du til å opna docx-fila?
Framgangsmåten eg måtte gjennom var dessutan mykje meir komplisert enn eg veit mange “ikkje-datakyndige” er i stand til å takla på eiga hand, så i praksis er docx-filene foreløpig relativt utilgjengelege for mange …
Har forresten testa OdfAddIn for Word 2003 òg, og redigera odt-dokument med Word. Enklare å få til enn OOo-prosedyra, men ikkje heilt god løysing dette heller. Kan f.eks. ikkje dobbeltklikka direkte på odt-fila … Dette er òg basert på duplisering av filer, slik at ein må ha ein “original” i Word-format uansett. Konverteringa mellom formata var dessutan svært treig samanlikna med odf-converter!
Shahzad Rana arresterer Håkon W. Lie! På en liten teknisk detalj. Kanskje i allefall. Litt?…
Rana er frempå igjen – denne gangen med en krass irettesettelse av Håkon Wium Lie (som vel er kjent for de fleste). Håkon ble intervjuet om OOXML for litt siden og Rana forsøker å motbevise dette ved å åpne et……
Testdokumentet ditt er ikke skrevet i OOXML. Det er en gammelt word-dokument som er pakket inn på en måte som kamuflerer det som et OOXML-dokument, men det bruker alså ikke matematikken som er definert i OOXML-spesifikasjonen. Men matte-delen står langt uti spesifikasjonen og det er få som har lest seg fram til den delen ennå
@Vera:
Hva får deg til å komme med den påstanden? Du er klar over at du kan sette inn Equation 3.0 objekter også i Office 2007?
Fredirk, jada, joda, alle språk har muligheten til å peke på binærblobber. Ranas dokument bruker denne koden for å peke på Word-dokumentet:
(o:OLEObject Type=”Embed” ProgID=”Equation.3″ ShapeID=”_x0000_i1025″ DrawAspect=”Content” ObjectID=”_1267124795″ r:id=”rId5″/)
I HTML kunne du skrevet:
(HTML)(A HREF=”_1267124795″)(/A)(/HTML)
Men det betyr ikke at HTML støtter matte, eller?
OOXML har engne matta-tagger som Rana av en eller annen grunn velger å ikke bruke.
(Jeg har byttet ut klammene med paranteser for ikke å miste dem underveis. Du forstår sikkert hva jeg mener.
Et nytt dokument produsert i Word 2007 og med et innsatt Equation 3.0 objekt vil være identisk med dokumentet til Rana. Jeg lurer derfor fortsatt på hvorfor du kommer med påstanden om at dokumentet ikke er skrevet i OOXML, og at det er et gammelt Word-dokument som er “kamuflert” som OOXML.
Fredirk, vis oss OOXML-koden dersom du fortsatt hevder formelen er skrevet i OOXML. Vis oss taggene, vis oss oppmerkingen.
(Du vil ikke finne den. Formelen er skrevet i et gammelt, udokumentert, lukket Microsoft-format)
Jeg har lyst til å vende tilbake til utgangspunktet for denne diskusjonen: Trenger man å kjøpe lisens til Microsoft Word 2007 for å kunne bruke dokumenter lagret i OOXML? Eller holder det med et gratisprogram (som OpenOffice.org 2.4) samen med en gratis konverter som odf-converter-integrator som så vidt jeg forstår er kombinasjonen som Shahzad benytter i sitt eksempel?
Man kan jo for eksempel ta en titt på dette dokumentet. Det går greit å åpne dette dokumentet i andre program enn Microsoft Word 2007 – men jeg har fortsatt til gode å finne et slikt program der man ikke mister informasjon.
Når man ikke kan stole på at den løsningen man benytter ikke fjerner informasjon, så har man ett problem. I dette tilfellet skjer dette uten at man melding om at informasjon blir fjernet. Har man aldri sett originalen vet man ikke en gang at noe er galt! Man kan altså risikere å miste viktig informasjon uten å være klar over det.
Jeg har aldri sagt at formelen er skrevet i OOXML, jeg har tvertimot gjentatt to ganger at et er et Equation 3.0 objekt som er satt inn i et OOXML-dokument.
Fint, da er vi enige. Formelen er ikke skrevet i OOXML.
Du innser også at binærformatet er lukket og udokumentert fra Microsoft sin side? Du må betale en “skatt” for å få tilgang til dokumentasjonen. Eller kan du gi oss en peker til spesifikasjonen?
Rana har hele tiden gjort det klart at det er snakk om et Equation 3.0 objekt. Du hevdet derimot at det opprinnelig var et gammelt Word-dokument som var kamuflert som OOXML. Så feil kan man ta.
Jeg har forøvrig ingen formening om at de som har laget konverteren har betalt noen skatt til Microsoft eller ikke. Det klarer sikkert de å svare bedre på enn det jeg kan.
Fredik,
Det er samme formatet som brukes i Word. Linux identifiserer det som “Microsoft Office Document”:
$file oleObject1.bin
oleObject1.bin: Microsoft Office Document
Det er altså et binært Office-dokument kamuflert på innsiden av et OOXML-dokument.
Det er veldig behagelig for deg å ikke ha noen formening om hva det vil koste å kjøpe dokumentasjonen på formatet.
Microsoft-skatten lever dessverre i beste velgående og det er bra Håkon Wium LIe tør å si fra om dette.
Nå har du fått tre sjanser til å skrive navnet mitt riktig, Vera. Det kan ikke være sååå vanskelig?
Forøvrig: Nei, det er ikke et binært Office-dokument kamuflert på innsiden av et OOXML-dokument. Det er et binært objekt av typen Equation 3.0 som er satt inn i et OOXML-dokument.
Siden du er så opptatt av kostnadene til dokumentasjonen til formatet regner jeg med at du sjekker opp hva de har betalt for den de som har laget converteren.
F (best slik:)
Ser du ikke problemet med at Rana publiserer en fil som utgir seg for å være OOXML, men som ingen kan få lese spesifikasjonen på uten å inngå avtale med Microsoft?
Jeg er enig med Hannemyr. Hans mer helhetlige perspektiv er mye viktigere enn hvorvidt Ranas test-dokument kan vises ved hjelp av gratis tilgjengelig programvare eller ikke.
Problemet med Ranas test er at det kun blir en stikkprøve som på ingen måte vil kunne gi et svar på om Wium Lies påstand er riktig eller ikke.
Når Rana velger å kontre Wium Lies påstander ved praktiske forsøk som ikke beviser noen ting (en analog for dem som ikke ser deti: -ikke alle sauer er hvite. -jo det er de, se på denne. den er hvit.) fremfor å heller kontre Wium Lies argumenter om en “microsoft-skatt” med at det er for tidlig å avgjøre ettersom standarden knapt finnes ferdig i skriftlig form og at det selvsagt vil ta tid før man kan begynne å evaluere verktøy for denne standarden, vil han ikke kunne vinne. Han kunne argumentert med at foreløpig er alt “beta” og siden den ferske standarden er såkalt åpen bør/vil verktøymakerne løse eventuelle problemer.
Men det er kanskje en grunn til nettopp at Rana ikke motargumenterer slik: dersom f.eks. Microsoft ved Rana bruker en slik argumenentasjon innrømmer de samtidig at alle OOXML-verktøy på markedet er umodne og ufullstendige og dermed gjør de det veldig lett for moderniseringsministeren å velge vekk OOXML fra listen med referanseformater og fortsatt ha god samvittighet.
Men sannheten er at OOXML-implementasjonene i dag er altfor umodne til at det er noen grunn til at Røys skal en gang vurdere OOXML som et alternativ til ODF.
>Siden du er så opptatt av kostnadene til dokumentasjonen til
>formatet regner jeg med at du sjekker opp hva de har betalt
>for den de som har laget converteren.
oj oj oj…
Bra du viser deg å være en idiot på dine egne sider også!
Godt jobba Fredrdick
En liten teknisk detalj:
.docx-filer er Zip-komprimert. Filene har en PK header og hvis man endrer filendelsen til .zip og åpner filen så vil man se en katalogstruktur som ser slik ut:
[Content_Types].xml
docProps\app.xml
docProps\core.xml
word\document.xml
word\fontTable.xml
word\settings.xml
word\styles.xml
word\theme
word\webSettings.xml
word\_rels
word\theme\theme1.xml
word\_rels\document.xml.rels
_rels\.rels
Så binærformat er det.
Øh, glemte seff å si at i tillegg til disse standard-tingene så inneholder ligning-filen disse:
embeddings\oleObject1.bin
media\image1.wmf
Zip,
> Så binærformat er det.
Nej – container-filformat er binært. Dokumentformatet er XML.
(Det er i øvrigt på samme måde ODF laves)
Her er mitt tilsvar:
http://www.dagbladet.no/dinside/2008/04/14/532498.html
Hei Håkon,
Jeg har sett det og allerede besvart deg.
[...] ordens skyld så ønsker jeg å føye til at vi jobbet med samme filen. Altså filen fra 19. mars. Åpne brevet til Wium Lie. Løsningen på filen som Wium Lie ikke klarte å [...]
Shahzan Rana: Kunne du endret stilarket på siden til å vise lenker tydeligere? Jeg så lenken til svaret ditt tilfeldigvis fordi jeg flyttet musen over teksten “besvart deg” i posten din over.
Hei Robert,
Takk for godt innspill! Jeg skal “leke” med litt med WordPress og finne noen andre maler i kveld.
Enig med deg i at den malen jeg bruker nå ikke viser lenker tydelig.
Jesper Lund Stocholm,
Det var embeddings\oleObject1.bin jeg siktet til, men jeg rotet med dokumentene (jeg hadde et annet dokument som jeg lekte med i tillegg til ligning-filen).
Zip,
Tror du ikke, at du burde sætte dig lidt ind i den tekniske side af sagen inden du udtaler dig igen?
… eller du mener måske, at muligheden for at indlejre arbitrære objekter skal fjernes fra OOXML og ODF?
Jesper,
når det gjelder innpakking av binære blobs, sjekk diskusjonen under innlegget “Håkon Wium Lies svar” ( http://blog.rana.io/2008/04/14/hakon-wium-lies-svar/ ), der har man allerede diskutert dette.
Og for min del: ja, det burde ikke vært lov å innlemme all mulig slags proprietære binærdata i OOXML-dokumenter og allikevel påberobe seg at man er “i henhold” til standarden og smile og le om at OOXML er så fint fordi det er en åpen standard, et åpent dokumentformat etc.
Johnny,
Du er klar over, at man kan nøjagtig det samme i ODF, ikke?
Hvad mener du alternativet skal være?
Skal der laves en “white-list” over godkendte ting, man kan putte i sit dokument?
Skal denne white-list kun indeholde ting, der er standardiserede i en eller anden form?
Jesper, det stemmer ikkje. I ODF er det ikkje lov å pakke data som kan representerast som XML inn i ei binærboble. Berre data som ikkje har ein XML-representasjon kan leggjast inn som binærkode i ODF. I OOXML kan du pakke inn kva som helst av propietære data i binærkode.
Skilnaden er vesentleg. Dersom til dømes Microsoft vil fylgje ordre frå sjefen og gjere formatet sitt ulesleg for andre, kan dei leggje delar av teksten inn i binærbobler. Det har dei lov til i OOXML, men ikkje i ODF. Difor er ODF ubrukleg for Microsoft og OOXML ubrukleg for alle andre enn Microsoft.
Sturle,
Du taler om netop ét af problem-afsnittene i ODF-spec, nemlig afsnit 9.3.3 omkring indlejring af objekter i et ODF-dokument.
Problemet er, at afsnittets indhold ikke er udtømmende. Den omtaler nemlig kun objekter, der har en OpenDocument repræsentation og “alt andet” (og omtaler disse som “binære”).
Det er direkte forkert at læse afsnit 9.3 og konkludere, at man ikke må pakke en XML-fil ind i en wrapper. Afsnit 9.3.3 omtaler nemlig KUN hvordan et OpenDocument objekt skal håndteres og ikke hvordan alle mulige objekter skal håndteres.
Hvordan mener du, at en TXT-fil skal indlejres? Hvad med en SVG-fil eller en HTML-fil? Ingen af disse filer er “OpenDocument representation”, da listen i ODF-spec klart siger, at
A document in OpenDocument format can contain two types of objects, as follows:
Objects that have an OpenDocument representation. These objects are:
– Formulas (represented as [MathML])
– Charts
– Spreadsheets
– Text documents
– Drawings
– Presentations
Med ei TXT-fil meinar du vel eit tekstdokument? Eit tekstdokument er eit tekstdokument, det kan skildrast med XML.
Du blandar saman dokument og vedlegg. Dersom du skal bruke HTML-fila til noko nyttig må du leggje ho ved som ei HTML-fil. Dersom du skal skrive ein handbok om HTML, er det naturleg å bake HTML-koden inn i teksten som XML. Dersom du vil syne fram innhaldet som ferdig rendra HTML til nokon som ikkje har ein web-lesar, er det naturleg å konvertere til XML Eg forstår ikkje kvar du vil hen. ODF er eit dokumentformat, ikkje eit filsystem.
Sturle,
Jeg tror desværre, at grunden til, at du ikke forstår mig er, at du ikke forstår mekanismerne til indlejring af objekter i ODF og OOXML.
Du skrev:
“I ODF er det ikkje lov å pakke data som kan representerast som XML inn i ei binærboble. Berre data som ikkje har ein XML-representasjon kan leggjast inn som binærkode i ODF.”
Og det er direkte, faktuelt, 100% forkert.
Du glømde det vesentlege punktet i #36, den andre av dei to typane:
Objects that do not have an XML representation. These objects only have a binary representation, An example for this kind of objects OLE objects (see [OLE]).
Det er akkurat det eg skriv. Meinar du at eit tekstdokument (“TXT-fil”) må pakkast inn i eit binært objekt fordi det er ei binærfil utan XML-representasjon i ODF? Sjå herifrå og nedover for ein utfyllande diskusjon om emnet:
http://blog.rana.io/2008/04/14/hakon-wium-lies-svar/#comment-381
Sturle,
Du taler udenom. Du sagde:
“I ODF er det ikkje lov å pakke data som kan representerast som XML inn i ei binærboble. Berre data som ikkje har ein XML-representasjon kan leggjast inn som binærkode i ODF.”
Hvor står det i ODF-spec?
På linja under det du siterte i #36.
Sturle,
Hold nu op
)
Der står:
* Objects that do not have an XML representation. These objects only have a binary representation, An example for this kind of objects OLE objects (see [OLE]).
The element represents objects that have a XML representation. The element represents objects that only have a binary representation.
Hvordan konkluderer du, at
“I ODF er det ikkje lov å pakke data som kan representerast som XML inn i ei binærboble. Berre data som ikkje har ein XML-representasjon kan leggjast inn som binærkode i ODF.”?
Der står envidere:
Object Data:
The object data can be called in one of the following ways:
• The xlink:href attribute links to the object representation, as follows:
– For objects that have an XML representation, the link references the sub package of the object. The object is contained within this sub page exactly as it would as it is a
document of its own.
– For objects that do not have an XML representation, the link references a sub stream of the package that contains the binary representation of the object.
(…)
The object data is contained in the or element, as follows:
– The element contains the XML representation of the object, for example, an or a element.
– The element contains an element, which contains the binary data for the object in BASE64 encoding.
Hvordan konkluderer du, at
“I ODF er det ikkje lov å pakke data som kan representerast som XML inn i ei binærboble. Berre data som ikkje har ein XML-representasjon kan leggjast inn som binærkode i ODF.”?
Der hvor jeg tror, at du tager fejl er, at du siger at “OpenDocument representation” = “XML-representasjon”
Men det er direkte forkert. Listen over objekter, der er “OpenDocument Representation” er i afsnit 9.3.3
Objects that have an OpenDocument representation. These objects are:
– Formulas (represented as [MathML])
– Charts
– Spreadsheets
– Text documents
– Drawings
– Presentations
Jeg prøver å se på dokumentet ditt som et xml-dokument, men det får jeg ikke til. Når jeg åpner det med en texteditor får jeg opp ting som dette:
PK
Hei Øyvind,
Du kan ikke åpne .docx og .odt filer direkte som et XML-dokument. Disse filene er ZIPet og du må først pakke dem ut.
Takk for svar. Nå får jeg lest det meste av xml-delene.
Stemmer det at jeg ikke skal kunne redigere innholdet i dokumentet du har lenket til?
[...] a recnt post on Shahzad Rana’s (Microsoft’s most profiled OOXML promoter in Norway) blog, he [...]