HTML
Utvidelser | .html, .htm |
---|---|
MIME-type | text/html |
Utviklet av | World Wide Web Consortium & WHATWG |
Innledende versjon | 1993 |
Formattype | Markup språk |
Basert på | Standard generalisert merkespråk |
Opprinnelse til | XHTML |
Standard |
ISO / IEC 15445 W3C HTML 4.01 W3C HTML5 |
ISO | 15445 |
Spesifikasjon | Åpent format |
Nettsteder |
www.w3.org/html html.spec.whatwg.org/multipage w3c.github.io/html |
Den Hypertext Markup Language , vanligvis forkortet HTML eller i sin nyeste HTML5 er den kodespråk utviklet for å representere nettsider .
Dette språket tillater:
Den brukes ofte i forbindelse med JavaScript- programmeringsspråk og Cascading Style Sheets (CSS). HTML er inspirert av SGML ( Standard Generalized Markup Language ). Dette er et åpent format .
Det engelske Hypertext Markup Language oversetter bokstavelig talt til hypertext markup språk . Vanligvis brukes akronymet HTML, noen ganger til og med ordet "språk" som i "HTML-språk". Hypertekst er noen ganger skrevet HyperText for å markere T i akronymet HTML.
Den noen ganger uinformerte offentlige talesystemet HTM i stedet for HTML, hvor HTM er filtypenavnet forkortet til tre bokstaver, en begrensning som finnes på eldre operativsystemer fra Microsoft .
I løpet av første halvdel av 1990-tallet , før fremveksten av web-teknologi som for eksempel Javascript (JS), Cascading Style Sheets (CSS), og Document Object Model (Dom), utviklingen av HTML diktert utviklingen av World Wide Web . Siden 1997 og HTML 4 har utviklingen av HTML avtatt betraktelig; 10 år senere brukes HTML 4 fortsatt på websider . I 2008 er spesifikasjonen av HTML5 under utredning og blir vanlig bruk i andre halvdel av 2010-tallet .
HTML er en av de tre oppfinnelsene som dannet grunnlaget for World Wide Web , sammen med Hypertext Transfer Protocol (HTTP) og nettadresser ( URLer ). HTML ble oppfunnet for å gjøre det mulig å skrive hypertekstdokumenter som knytter forskjellige internettressurser til hyperkoblinger . I dag kalles disse dokumentene " webside ". IAugust 1991, når Tim Berners-Lee offentlig annonserer nettet på Usenet , siterer han bare SGML , men gir nettadressen til et suffiksdokument.html.
I sin bok Weaving the web , beskriver Tim Berners-Lee beslutningen om å basere HTML på SGML som "diplomatisk" som det er teknisk: teknisk sett syntes han SGML var for komplisert, men han ønsket å tiltrekke seg hypertekstsamfunnet som så på SGML som språket. det mest lovende for standardisering av formatet på hypertekstdokumenter. I tillegg var SGML allerede i bruk av arbeidsgiveren sin, European Organization for Nuclear Research (CERN). ;
De første elementene i HTML inkluderer:
Beskrivelsen av HTML er da ganske uformell og hovedsakelig definert av støtte fra forskjellige moderne nettlesere . Dan Connolly bidro til å gjøre HTML til et ekte SGML- program .
HTML-tilstanden tilsvarer da det vi kan kalle HTML 1.0 . Imidlertid er det ingen spesifikasjoner med dette navnet, spesielt fordi språket var i full utvikling på den tiden. Men en standardisering innsats var i gang. Fra slutten av 1993 ble begrepet HTML + brukt om den fremtidige versjonen av HTML. Til tross for standardiseringsinnsatsen som ble initiert, og frem til slutten av 1990-tallet , ble HTML hovedsakelig definert av nettleserimplementeringer.
Med nettleseren NCSA Mosaic kjenner HTML to hovedoppfinnelser:
Med utseendet til Netscape Navigator 0.913. oktober 1994, støtte for mange presentasjonselementer er lagt til: tekstattributter, blinking, sentrering, etc.
HTML-utvikling tar deretter to forskjellige veier:
Designere følger SGMLs prinsipper om å legge presentasjonen til et stilspråk. I dette tilfellet er Cascading Style Sheets (CSS) ment for HTML. Bare støtte fra tabeller blir raskt integrert i nettlesere, spesielt fordi det gir en veldig klar forbedring av presentasjonen. I tillegg til multiplikasjonen av presentasjonselementer, blir programvare som produserer og bruker HTML ofte oppfattet av dokumenter som en serie formateringskommandoer i stedet for som en markering som representerer trestrukturen i dag kjent som Document Object Model (DOM). Mangelen på struktur av HTML som deretter ble implementert blir noen ganger fordømt som " tag suppe ", på engelsk : tag suppe .
I Mars 1995tilbyr det nystiftede World Wide Web Consortium (W3C) resultatet av sin forskning på HTML +: HTML 3.0- utkastet . Den inkluderer støtte for tabeller, figurer og matematiske uttrykk. Dette utkastet utløper den28. september 1995uten å gi direkte oppfølging. På slutten av 1995 ble RFC 1866 som beskriver HTML 2.0 ferdigstilt. Hovedredaktøren er Dan Connolly . Dette dokumentet beskriver HTML slik det eksisterte førJuni 1994, så uten de mange tilleggene til Netscape Navigator .
De 14. januar 1997, publiserer W3C HTML 3.2- spesifikasjonen . Den beskriver gjeldende praksis observert i begynnelsen av 1996 , derfor med en del av tilleggene til Netscape Navigator og Internet Explorer . De viktigste nyhetene er standardisering av bord og mange presentasjonselementer. HTML 3.2 går foran HTML 4.0 smalt og inneholder elementer for styling og scripting-støtte.
De 18. desember 1997, W3C publiserer HTML 4.0- spesifikasjonen som standardiserer mange utvidelser som støtter stiler og skript, rammer og objekter (generalisert innholdsinnbefattelse). HTML 4.0 gir også forskjellige forbedringer for tilgjengeligheten av innhold, hovedsakelig muligheten for en mer eksplisitt skille mellom struktur og presentasjon av dokumentet, eller støtte for tilleggsinformasjon om bestemt komplekst innhold som skjemaer, tabeller eller akronymer. HTML 4.0 introduserer tre varianter av formatet, ment å fremme utviklingen mot mer meningsfull markering, samtidig som det tas hensyn til de midlertidige begrensningene for produksjonsverktøy:
Disse variasjonene fortsetter deretter uten vesentlige endringer i HTML 4.01 og i XHTML 1.0 overgangsformat fra HTML. Den siste HTML-spesifikasjonen er versjon 4.01 datert24. desember 1999. Det gjør bare mindre rettelser til versjon 4.0 .
Utviklingen av HTML som en applikasjon av Standard Generalized Markup Language (SGML) er offisielt forlatt til fordel for XHTML , en applikasjon av Extensible Markup Language (XML). I 2004 opprettet imidlertid utgivere av nettlesere nettet Hypertext Application Technology Working Group (WHATWG) med særlig mål om å starte utviklingen av HTML-format på nytt og møte nye behov på et teknologisk grunnlag som anses lettere implementerbart enn det. den XHTML 2.0 blir utformet. Dette er en del av konteksten til en mer generell utfordring for driftsmåten til W3C, som av noen utviklere og webdesignere anses å være for lukket.
I Mars 2007, som trekker konsekvensen av motvilje fra en del av bransjen og webinnholdsdesignere til å møte XHTML 2.0 , lanserer W3C utviklingen av HTML på nytt og oppretter en ny arbeidsgruppe overvåket av Chris Wilson ( Microsoft ) og i utgangspunktet Dan Connolly ( W3C ), nå Michael Smith ( W3C ). Disse inkluderer:
Arbeidet til WHATWG ble formelt vedtatt i Mai 2007som utgangspunkt for en ny HTML5- spesifikasjon . Dette dokumentet ble publisert som et Working Draft on22. januar 2008. Blant designprinsippene nevnt av arbeidsgruppen er spesielt:
En tilgjengelighetsgruppe opprettes av W3C inovember 2009for å løse kompatibilitetsproblemene i det nye formatet med tilgjengelighetsstandarder , spesielt knyttet til implementeringen av ARIA , til tekstalternativer og til nye elementer canvasog video.
Utviklingen av XHTML 2.0 fortsetter i utgangspunktet parallelt som svar på behovene til andre nettområder, for eksempel mobile enheter, bedriftsapplikasjoner og serverapplikasjoner. Så innjuli 2009, bestemmer W3C seg for ikke å fornye XHTML 2- arbeidsgruppen på slutten av 2009.
Med oppgivelsen av XHTML 2 forblir versjon XHTML 1.1 derfor den standardiserte versjonen. HTML5 vil være kompatibel med XHTML og XML, og vil derfor tillate XHTML5- dokumenter . Imidlertid er det sannsynlig at W3C går mot en direkte oppgivelse av XHTML 1.1 , fordi implementeringen av XML i HTML5 gjør definisjonen av dokument av typen XHTML y unødvendig . y (hvor yy er versjonsnumrene).
I januar 2011, meningsforskjeller mellom Ian Hickson (ingeniør hos Google), som skriver HTML5-spesifikasjonen, og medlemmene av W3C-arbeidsgruppen leder WHATWG for å lage HTML- levestandard (bokstavelig talt: levestandard for HTML), en spesifikasjon av HTML ment å være i stadig utvikling for å holde fast i den raske utviklingen av nye funksjoner fra utviklere av nettlesere (i motsetning til nummererte versjoner, derfor "faste").
Den HTML levestandard som mål å inkludere HTML5, og å utvikle den kontinuerlig. Spesielt i versjonen av22. august 2012, forklarer referansedokumentet at W3C HTML5, publisert på 22. juni 2012, er basert på en versjon av HTML Living Standard , men at HTML Living Standard ikke stopper ved denne versjonen, og fortsetter å utvikle seg. Den utvikler spesielt forskjellene mellom W3C-versjonen (HTML5) og HTML Living Standard- versjonen (for eksempel blir ikke nye feil tatt i betraktning i HTML5, syntaktiske forskjeller er oppført, og nye koder opprettet av HTML Living Standard er ikke inkludert i HTML5).
HTML er et beskrivelsesspråk for dokumentformat som har form av et kodespråk hvis syntaks kommer fra Standard Generalized Markup Language (SGML).
Fram til og med versjon 4.01 blir HTML formelt beskrevet som en applikasjon av Standard Generalized Markup Language (SGML). Suksessive spesifikasjoner innrømmer imidlertid på forskjellige måter at brukeragenter i praksis ikke er i samsvar med SGML- parsere . De nettlesere har ikke vært i stand til å tyde alle varianter er tillatt ved syntaks av SGML ; på den annen side er de generelt i stand til automatisk å fange mange syntaksfeil, ifølge den første delen av " Postels lov ": "Vær liberal i det du aksepterer, og konservativ i det du sender" ( RFC 791). Faktisk har utviklere av websider og nettlesere alltid tatt stor frihet med de syntaktiske reglene til SGML . Til slutt ble ikke HTML- dokumenttypedefinisjonen (DTD), den formelle tekniske beskrivelsen av HTML, skrevet av Dan Connolly før noen få år etter introduksjonen av HTML.
Til tross for frihetene som er tatt med standarden, brukes terminologien som er spesifikk for SGML : dokument, element, attributt, verdi, merke, enhet, gyldighet, applikasjon, etc. Takket være DTD er det mulig å sjekke gyldigheten til et HTML-dokument automatisk ved hjelp av en SGML- parser .
Opprinnelig ble HTML designet for å bare markere (eller merke opp) tekst, inkludert å legge til hyperkoblinger til den. Vi brukte et minimum av koder, som i følgende HTML-dokument:
<TITLE>Exemple de HTML</TITLE> Ceci est une phrase avec un <A HREF=cible.html>hyperlien</A>. <P> Ceci est un paragraphe où il n'y a pas d'hyperlien.Dette eksemplet inneholder tekst, fem koder og en enhetsreferanse:
Et gyldig HTML-dokument er et dokument som respekterer SGML- syntaks , bare bruker standardiserte elementer og attributter, og respekterer nestingen av elementer som er beskrevet av standarden. Bare en dokumenttypedeklarasjon mangler fra forrige eksempel for at det skal være et gyldig HTML 2.0-dokument.
Et gyldig dokument er imidlertid ikke tilstrekkelig til å være i samsvar med den målrettede HTML-spesifikasjonen. I tillegg til gyldighetskravet, er et samsvarende dokument underlagt andre begrensninger som ikke uttrykkes av dokumenttypedefinisjonen (DTD), men som uttrykkes av selve spesifikasjonen. Dette er spesielt tilfelle for innholdstypen til visse attributter, som for attributtet datetime : for å være i samsvar med HTML 4.01 , må den selv overholde en delmengde av ISO 8601- standarden . En strengt SGML- parser som W3C HTML-validator kan derfor ikke garantere samsvaret til et HTML-dokument.
I de tidlige årene ble HTML-dokumenter ofte sett på som flate strukturer, og koder som stilkommandoer. Så taggen <p>ble ansett som et linjeskift, og taggen </p>ble ignorert. Eller når JavaScript 1.0 dukket opp, ga det bare tilgang til dokumentlenker og skjemaer gjennom tabeller document.formsog document.links.
Med introduksjonen av Cascading Style Sheets og Document Object Model ble det nødvendig å vurdere at HTML-dokumenter har en ekte trestruktur , med et rotelement som inneholder alle de andre elementene. Åpnings- og lukkemerkene til disse elementene forblir valgfrie. Imidlertid er det i dag en tendens til å markere hvert element og indikere DTD. Med unntak av rotelementet har hvert element nøyaktig ett direkte overordnet element; dette “dokumenttreet” brukes spesielt av formateringsstrukturen som er avledet fra det for anvendelse av kaskadestilark der hvert element kan ha sin egen bakgrunn, kant og margin.
Nettstrukturen og koden kan også konsulteres ved å legge til view-source:foran url på siden. For den nåværende siden som vil gi . view-source:https://fr.m.wikipedia.org/wiki/Hypertext_Markup_Language
HTML-kilde | Dokumentmal |
---|---|
<!DOCTYPE html PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html> <head> <title> Exemple de HTML </title> </head> <body> Ceci est une phrase avec un <a href="cible.html">hyperlien</a>. <p> Ceci est un paragraphe où il n’y a pas d’hyperlien. </p> </body> </html> |
html hode tittel tekst kropp tekst på tekst tekst s tekst |
Den versjon 4 av HTML beskriver 91 elementer . Etter spesifikasjonen av HTML 4 kan funksjonene som implementeres av HTML fordeles som følger:
Generell struktur for et HTML-dokument På høyeste nivå er et HTML-dokument skilt mellom en overskrift og en kropp. Overskriften inneholder informasjon om dokumentet, inkludert tittelen og muligens metadata . Kroppen inneholder det som vises. Språkinformasjon Det er mulig å indikere språket i hvilken som helst del av dokumentet og å administrere blandingen av tekst skrevet fra venstre til høyre med tekst fra høyre til venstre . Semantisk merking HTML hjelper til med å skille spesifikt innhold, for eksempel sitater fra eksterne verk, kodebiter fra datamaskiner, fremhevede passasjer og forkortelser. Noen av disse elementene, opprinnelig designet for å støtte teknisk dokumentasjon, brukes svært sjelden (differensiering mellom variable og eksempelverdier i en datamaskinkode, for eksempel, eller til og med en forekomst av et begrep definert i konteksten). Lister HTML skiller mellom uordnede og ordnede lister , avhengig av om den formelle rekkefølgen på innholdet i koden er informasjon i seg selv. De definisjons listene også eksistere, men deres omfang er nøyaktig bestemt. Tabeller Denne funksjonaliteten brukes formelt til presentasjon av tabelldata, men ble hovedsakelig utnyttet for sine layoutmuligheter før Cascading Style Sheets (CSS) nådde en tilstrekkelig modenhetsgrad. Hyperkoblinger Den primære funksjonaliteten til HTML. Inkludering av bilder, applets og diverse gjenstander Opprinnelig tillot HTML bare hyperkoblinger til eksterne medier. Oppfinnelsen av spesialiserte elementer for multimedia tillot automatisk inkludering av bilde, musikk, video, etc. på websider. Gruppering av elementer Disse generiske elementene gir ingen betydning for innholdet de markerer, og gjør det mulig å bruke presentasjonsstiler, å utføre behandling via skript eller andre operasjoner som krever å isolere deler av innholdet. Presentasjonsstil Hvert element, eller til og med hele dokumentet, kan ha stiler. Stiler defineres i dokumentet eller kommer fra eksterne Cascading Style Sheets (CSS). Merking av tekstpresentasjon Utviklet før generaliseringen av CSS for raskt å gi funksjonalitet til grafiske designere. Det meste av bruken er nå offisielt motløs. Rammer Også kjent som rammer , en ofte kritisert funksjon som lar deg vise flere HTML-dokumenter i ett vindu. Skjema for interaktiv datainnføring Skjemaelementer lar besøkende legge inn tekst og filer på websider. Skript Brukes til å knytte programstykker til brukerhandlinger på dokumentet. Språkene som brukes er vanligvis JavaScript og VBScript .Attributter lar deg spesifisere egenskapene til HTML-elementer. Det er 188 attributter i HTML- versjon 4 .
Noen attributter gjelder nesten alle elementer:
Andre attributter er unike for et enkelt element eller lignende elementer. For eksempel :
De fleste attributtene er valgfrie. Noen elementer har imidlertid obligatoriske attributter:
Innholdstypen av HTML-attributter ligger delvis utenfor omfanget av denne standarden, og validering av den faller inn under tredjepartsstandarder som URI , innholdstyper eller språkkoder .
Til slutt er noen attributter av boolsk type. Dette er de eneste attributtene hvis syntaks kan være gyldig implisitt i HTML: attributtet selectedtil en skjemakontroll kan således forkortes til skjemaet som selectederstatter hele skjemaet selected="selected". Denne spesielle formen er et av punktene som skiller HTML fra syntaksen til "velformede" dokumenter i XML-forstand.
Nettsider kan skrives på alle slags språk, og veldig mange tegn kan brukes, noe som krever enten ett tegnsett per skrivetype eller ett universelt tegnsett. Da HTML dukket opp, var Unicode universelle tegnsett ennå ikke oppfunnet, og mange tegnsett ble brukt ved siden av hverandre, inkludert ISO-8859-1 for det latinske og vest-europeiske alfabetet , Shift-JIS for japanerne , KOI8-R for Kyrillisk . I dag er koding av UTF-8 til Unicode mest utbredt.
Den HTTP kommunikasjonsprotokoll sender navnet på tegnsett. HTML-overskriften kan inneholde en påminnelse om dette tegnsettet, som skal være det samme, med mindre det er en innstillingsfeil. Til slutt, etter en feil innstilling, kan tegnsettet faktisk brukes fremdeles avvike fra det annonserte settet. Disse uriktige innstillingene forårsaker vanligvis tekstvisningsfeil, spesielt for tegn som ikke dekkes av ASCII- standarden .
EksosteknologiFør generaliseringen av Unicode ble enheter definert til å representere visse ikke- ASCII- tegn . Det startet med tegnene i ISO 8859-1 i HTML 2.0- standarden . For diakritikere følger disse enhetene et enkelt prinsipp: bokstaven etterfulgt av forkortelsen av den tilhørende diakritiske.
karakter | enhetsreferanse | Merk |
---|---|---|
PÅ | Á | acutefor den akutte aksenten |
PÅ | Â | circfor circumflex aksent |
PÅ | À | gravefor den alvorlige aksenten |
PÅ | Å | ringfor sjefrunden |
PÅ | Ã | tildefor tilde |
PÅ | Ä | umlfor umlaut |
VS | Ç | cedilfor cedillaen |
Ø | Ø | slashfor skråstrek |
Som formalisert av W3C , er HTML designet for å optimalisere interoperabilitet av dokumenter. HTML brukes ikke til å beskrive den endelige gjengivelsen av websider . Spesielt, i motsetning til desktop publishing , er HTML ikke designet for å spesifisere det visuelle utseendet til dokumenter. I stedet er HTML designet for å gi mening om de forskjellige delene av teksten: tittel, liste, viktig skriftsted, sitat osv. HTML ble utviklet med den intuisjonen at enheter av alle slag ville bli brukt til å surfe på nettet: personlige datamaskiner med skjermer med ulik oppløsning og fargedybde, mobiltelefoner, datasyntes- og gjenkjenningsenheter. Tale, datamaskiner med lav og høy båndbredde og så videre. på.
Siden HTML ikke fokuserer på den endelige gjengivelsen av dokumentet, kan det samme HTML-dokumentet vises med et bredt utvalg av maskinvare og programvare. På maskinvarenivå kan et dokument spesielt vises på en dataskjerm i grafisk modus eller en dataterminal i tekstmodus , det kan skrives ut, eller det kan snakkes ved stemmesyntese . På programvarenivå gjør ikke HTML antakelser heller, og flere typer programvare leser HTML: nettleser , crawler , forskjellige skript (i Perl , PHP ) for automatisk behandling.
En høy grad av interoperabilitet senker kostnadene for innholdsleverandører fordi en enkelt versjon av hvert dokument har et bredt spekter av behov. For nettbrukeren tillater interoperabilitet eksistensen av mange konkurrerende nettlesere, som alle kan se hele nettet.
Hver versjon av HTML har prøvd å gjenspeile størst enighet blant bransjeaktører, slik at investeringene som gjøres av innholdsleverandører ikke blir bortkastet og dokumentene deres raskt blir uleselige. Separasjonen av innholdet og formen ble ikke alltid respektert under utviklingen av språket, noe som for eksempel fremgår av markeringen av tekststilen, som gjør det mulig å angi spesielt ønsket skrift for visning, størrelse eller farge.