avoimen lähdekoodin versionhallintaohjelmisto From Wikipedia, the free encyclopedia
Git on hajautettu versionhallintajärjestelmä, joka on suunniteltu toimimaan tehokkaasti ja luotettavasti.[4][5]
Git | |
---|---|
Luoja | Linus Torvalds |
Kehittäjä | Linus Torvalds, Junio Hamano sekä lukuisia muita |
Kehityshistoria | |
Ensijulkaisu | 7. huhtikuuta 2005 |
Vakaa versio | 2.47.0 ()[1] |
Kehitystilanne | Aktiivinen |
Tiedot | |
Ohjelmistotyyppi | Versionhallinta |
Alusta | Linux, macOS, POSIX, Solaris, Windows |
Ohjelmointikielet | C, Bourne Shell, Perl, TCL[2] |
Lisenssi | GPLv2,[3] LGPL |
Aiheesta muualla | |
git-scm.com | |
Versiohallinta |
Git on suunniteltu POSIX-yhteensopiville käyttöjärjestelmille (mukaan lukien Linux ja macOS). Se toimii myös Microsoft Windowsilla; virallinen asennuspaketti perustuu MinGW MSYSiin ja sisältää myös tyypillisiä POSIX-ympäristöjen apuohjelmia, kuten Bash-komentotulkin ja OpenSSH-asiakasohjelman. Git voidaan asentaa Windowsiin myös Cygwin-järjestelmän osana. Unix-suunnittelufilosofian mukaisesti Git ei ole yksittäinen sovellusohjelma, vaan koostuu suuresta joukosta pienempiä sovelluksia, joista kukin toteuttaa yksittäisiä toimintoja.
Gitin sanotaan olevan kolmannen sukupolven versionhallintajärjestelmä, joka toimii hajautetusti ja seuraa muutosjoukkoja.[6] Muita vastaavia versionhallintajärjestelmiä ovat Mercurial ja GNU Bazaar.[6]
Gitin alkuperäinen kehittäjä Linus Torvalds kertoo hajautetun järjestelmän eduksi, että politikointi käyttäjäoikeuksista poistuu: jokaisella käyttäjällä on oma tietovarasto (engl. repository).[7] Hajautettu versionhallinta mahdollistaa myös helpot ja luotettavat varmuuskopiot ja henkilökohtaisten kokeellisten tietovarastojen käytön.[7] Aiemmissa järjestelmissä muutoksien yhdistäminen (engl. merge) oli monimutkainen operaatio.[7]
Linux-ytimen versionhallintaan käytettiin vuonna 2002 käyttöön otettua BitMoverin suljetun lähdekoodin BitKeeper-ohjelmistoa.[8] BitMover antoi BitKeeperin ilmaiseen käyttöön avoimen lähdekoodin projekteille, mutta sen ehtoja ja ratkaisua kritisoitiin.[8][7] BitKeeper käytti hajautettua mallia, joka inspiroi projekteja kuten GNU Arch, Darcs ja Monotone.[8]
Vuonna 2005 Andrew Tridgell pyrki tekemään BitKeeperiä käyttävän ohjelman takaisinmallinnuksella, joka oli vastoin BitKeeperin käyttöehtoja.[7] Torvalds yritti sovitella Tridgellin ja BitMoverin Larry McVoyn välillä, mutta päättivät lopettaa BitKeeperin käytön.[7][9] Katsottuaan vaihtoehtoja Torvalds päätti kirjoittaa oman hajautetun versionhallintajärjestelmän korvaajaksi, koska Linux-ytimen kehitystiimin tarpeet täyttävää avoimen lähdekoodin järjestelmää ei tuolloin ollut olemassa.[7][10] Kehityshetkellä olemassa olleissa muissa järjestelmissä oli omat ongelmansa kuten tiedostojen uudelleennimeämisen seuranta ja suorituskyky.[7]
Torvalds inhosi keskitettyä mallia kuten Subversionissa ja kehotti katsomaan vaihtoehtoja kuten Monotonea.[11][12] Torvalds kritisoi Monotonea eräistä seikoista kuten tavasta käyttää ”tietokanta per kehittäjä” -mallia eikä ”tietokanta per lähdekoodipuu” -mallia.[13][14] Myös Monotonen suorituskyky oli yksi vaikuttava tekijä: suorituskyky oli yksi keskeisistä vaatimuksista ja Monotone oli huomattavan hidas Linux-ytimen tiedostomäärällä.[13][8][15]
Torvalds kertoo aloittaneensa Gitin kehityksen 3. huhtikuuta 2005 viimeisen BitKeeperillä tehdyn ytimen version 2.6.12-rc2 julkaisun jälkeen.[16] Itseään tukeva (engl. self-hosting) Gitistä tuli noin päivässä: suuri osa kehitystyöstä ei ollut ohjelmakoodin kirjoittamista vaan tietojen käsittelyn suunnittelua.[7] Itseään tukevana pidetään kuitenkin 7. huhtikuuta tehtyä tallennusta.[17] Ensimmäinen muutoksien yhdistäminen Linux-ytimeen Gitillä tapahtui 17. huhtikuuta 2005.[18] Ensimmäinen Gitillä ylläpidetty Linux-ytimen julkaisu oli versio 2.6.12 kesäkuussa 2005.[19]
Torvalds on kertonut, että koska on käyttänyt BitKeeperiä pitkään toimintamalli vain seuraisi BitKeeperin mallia eikä sen teknisiä yksityiskohtia: Torvalds tietoisesti pyrki välttämään BitKeeperin kloonin tekemistä.[20][10]
Torvalds ilmoitti 27. heinäkuuta 2005 Gitin ylläpidon siirtymisestä Junio Hamanolle, joka oli innokas kehittäjä.[21][8]
Varhaiset Git-komennot olivat vaikeaselkoisia, jotka kehittyivät Hamanon kehittäessä työkaluja.[7][8]
”Git” tarkoittaa brittiläisessä slangissa hölmöä tai hyödytöntä henkilöä tai jääräpäistä henkilöä.[22][23] Linus Torvalds sanoi ”Olen itsekeskeinen paskiainen, joten nimeän kaikki projektit itseni mukaan. Ensin Linux, nyt git.” (”I'm an egotistical bastard, and I name all my projects after myself. First Linux, now git.”).[24] Kehityksen alkuvaiheissa nimeä kuvailtiin seuraavasti:[25]
»Linus Torvalds nimesi ohjelmiston ”gitiksi” kun hän loi ensimmäisen version. Hänen mukaansa kyseessä on ”tyhmä sisällönseurantaohjelmisto”, jota voidaan kuvailla mieltymysten mukaan:
- Satunnainen äännettävissä oleva kolmikirjaiminen nimi, jota olemassa oleva Unix-ohjelma ei käytä. Se, että se voidaan virheellisesti lausua kuten ”get”, on ehkä asiaan kuuluvaa.
- Tyhmä. Halveksittava ja kamala. Yksinkertainen. Valitse suosikkisi slangisanakirjasta.
- ”Globaali Informaatio-Trakkeri”: Kun olet hyvillä mielin ja se sattuu toimimaan. Enkelikuoro laulaa ja valo täyttää huoneen.
- ”Goddamn Idiotic Truckload of sh*t”: Kun se ei toimi.»
Git suunniteltiin olemaan mahdollisimman nopea (Linux-ytimeen tulee valtava määrä muutoksia), tukemaan hajautettua työskentelyä, ja estämään datan virheellisyys sekä katoaminen. Sen oli myös kyettävä hallitsemaan Linuxin valtavaa kokoluokkaa, toisin kuin monet muut järjestelmät, jotka eivät skaalaudu isojen hakemistopuiden hallintaan. Git suunniteltiin myös eri kehityshaarojen tehokkaaseen ja helppoon hyödyntämiseen.
Git on suunniteltu Unix-filosofian mukaiseksi ”työkalusarjaksi”: Gitissä on joukko ohjelmia, joista kukin tekee yhden tietyn asian hyvin.[26]
Useimmissa muissa versionhallintajärjestelmissä on seurattu Source Code Control Systemin (SCCS) ”ajatusmallia”: niissä eräät toiminnot ovat olleet rivikohtaisella toiminnolla ja ylemmän tason ”näkymä” on puuttunut.[27] Gitissä blame
-toiminto on laajempi ja annotate
taaksepäin yhteensopivuuden vuoksi muista järjestelmistä tulevia varten.[28][29]
Tiedostojen uudelleennimeäminen Gitissä on implisiittistä: sitä ei nimenomaisesti seurata vaan se tulee ”automaattisesti”.[27] Vanhemman CVS:n yleisenä heikkoutena pidetään sen tapaa tunnistaa koko päivityshistoria tiedoston nimen mukaan, jolloin tiedoston siirtäminen tai uudelleennimeäminen ei ole mahdollista joko keskeyttämättä tai uudelleennimeämättä sen historiaa, tehden siitä virheellistä. Useimmat uudemmat versionhallintajärjestelmät antavat tiedostoille oman pysyvän nimensä (tiedostojärjestelmissä käytetyn ”inoden” kaltaisen).[30] Git ei käytä tämänkaltaisia tunnisteita,[30][31] sillä koodia joudutaan välillä paloittelemaan tai yhdistelemään uudelleennimeämisen lisäksi.[32] Tämän ylöskirjaaminen pelkkänä uudelleennimeämisenä jäädyttäisi historian jälleen virheelliseksi, mistä johtuen Git tunnistaa uudelleennimeämiset automaattisesti tallennehistoriaa selaamalla sen sijaan, että se kirjattaisiin jo tallennushetkellä.[33] (Yksinkertaistettuna version N jokin tiedosto on uudempi kuin N-1:n. Kun N-1:stä ei löydy kyseisen nimistä tiedostoa, Git etsii tiedostoa joka löytyy vain tästä versiosta, ja on sisällöltään mahdollisimman samanlainen uudempaan verrattuna.) Tämä vaatii kuitenkin luonnollisesti enemmän säikeitä (kuormittaen siten prosessoria) sekä monenlaisia asetuksia kontrolloimaan heuristiikkaa.
Gitin on myös päätetty olevan seuraamatta tyhjiä hakemistoja. Tästä syystä pelkkien hakemistojen seuraamiseen on kansioon luotava aina vähintään yksi tyhjä tiedosto (esim. .gitignore
).[34]
Gitissä lähes jokainen operaatio on paikallinen: tämä mahdollistaa työskentelyn myös ilman jatkuvaa verkkoyhteyttä.[35] Paikallisen lisäksi voi käyttää jaettua verkkolevyä (kuten NFS) tai palvelinta (HTTP, SSH ja Git-protokollat).[36][37] Tietovarastoon voi liittää muita tietovarastoja, joihin viitataan lyhyillä nimillä (kuten origin, joka on oletusnimi tietovarastolle, josta olet kloonannut).[38] Esimerkiksi eri kehittäjien tietovarastoista voi hakea muutoksia omaan tietovarastoon (sekä paikallisesti että verkon kautta).[38]
Git eroaa useimmista versionhallintajärjestelmistä seuraamalla tilannekuvia (engl. snapshot) yksittäisten tiedostojen erojen (delta) sijaan.[35][27]
Gitin tietovarasto tukee useita lähdekoodipuita (worktree
).[39] Uusi lähdekoodipuu on ”linkitetty puu” eikä ”pääpuu” kuten init
- tai clone
-komennolla tehdessä.[39]
Kaikelle Gitissä säilötylle lasketaan tarkistussumma SHA-1 tiivistefunktiolla jolla muutokseen viitataan: tämän johdosta on mahdotonta muuttaa minkään tiedoston sisältöä ilman että versiohallinta tietää siitä, jolloin et voi kadottaa tietoa tai menettää tietoa korruptoitumiselle.[35] Torvaldsin mukaan ajatus sisällönosoittamistekniikasta on lainattu Monotonesta.[15][17] Gitin käyttämä sisällönosoittaminen ja tapa säilöä tietoa objekteissa (muutostiedostojen sijaan) mahdollistaa minkä vain sisällön tallentamisen Gitissä.[40]
Torvalds on kertonut kääntyneensä Bitkeeperin kehittäjän Larry McVoyn kannalle siinä, että ”kirsikan poimiminen” (engl. cherry picking, tiettyjen muutoksien valinta) on väärä toimintamalli, joka viittaa tiettyjen henkilöiden olevan ”ylhäällä” ja toisten ”alhaalla”: Linux-ytimen kehitys on entistä enemmän ”verkkomalli”, jossa Torvalds on vain ”keskeinen henkilö” eikä ”päällimmäinen”.[14] Git tukee eri toimintamalleja versiohallinnassa kuten keskitetty työmalli, integraationhoitajamalli ja hyväntahtoinen diktaattorimalli, joissa muutokset etenevät yhden tai useamman tietovaraston kautta.[41] Tiettyjen muutoksien valinta on mahdollista git cherry-pick
-komennolla.[42]
Gitissä haarojen (branch
) tekeminen ja niiden välillä vaihtaminen (switch
, checkout
) ovat nopeita ja se kannustaa toimintamalleihin, joissa haarautumista ja yhdistämistä (merge
) tehdään paljon.[43][44][45] Monissa versionhallintatyökaluissa haarojen tekeminen ja yhdistäminen on vaativa toimenpide, joka voi vaatia uuden kopion lähdekoodeista, joka on hidasta suurissa projekteissa.[43]
Haaran vaihtamisen yhteydessä Git pyrkii varmistamaan ettei tietoja kadoteta ja huomauttaa, jos työkopiossa on tallentamattomia muutoksia: muutokset voi tallettaa (commit
) tai vaihtoehtoisesti säilöä (stash
) jos muutokset eivät ole valmiita talletettavaksi.[46][47] Haaran vaihdossa Git pyrkii palauttamaan viimeisimmän talletuksen tilan.[46] Säilö (stash) toimii pinon kaltaisella periaatteella, jossa muutoksia säilötään päälle ja niitä haetaan päältä: lisäksi voi viitata suoraan haluttuun muutokseen jonka haluaa palauttaa päällimmäisenä olevan sijaan.[47]
Muutoksien yhdistäminen tukee erilaisia menetelmiä: resolve, recursive ja octopus, joista viimeisessä voi olla useita lähteitä yhdistettävänä.[48] Uudempi menetelmä on ort, jossa käytetään samoja konsepteja, mutta suorituskyky on parempi.[49][50] Jos haaraan yhdistetään muutoksia, jotka ovat lähdekoodipuussa suoraan edellä voidaan suorittaa ”pikakelaus” (”fast-forward”) eli vain päivitetään viittaamaan uudempaan ilman varsinaista yhdistysoperaatiota.[46] Samaan kohtaan kohdistuvat muutokset voivat aiheuttaa konfliktin, jossa ohjelma ei automaattisesti pysty päättelemään mikä on oikea lopputulos.[48][46] Konfliktin ratkaisuksi voidaan muokataan työversiossa olevaa lähdekoodia, johon on merkitty eri versioiden muutokset.[46]
Git tukee alimoduulien (submodule
) tallentamista osana laajempaa projektia: käyttökohde on erikseen seurattavat projektit jotka voivat riippua toisistaan.[51][52]
Projekti voi riippua toisista projekteista, joita käytetään myös toisissa projekteissa.[53] Lähdekoodin kopiointi jokaiseen projektiin joka käyttää sitä on työlästä ja vaikeuttaa päivittämistä.[53] Alimoduulilla voi viitata suoraan toiseen projektiin ilman sen kopioimista.[53] Alimoduuli viittaa tiettyyn talletukseen tietovarastossa.[53]
Alipuu (subtree
) tekee vastaavan kuin alimoduuli eli sallii toisen tietovaraston sijoittamisen toisen alle, mutta ei käytä erillistä seurantaa sen hakemistopuulle.[53][54]
Yksinkertaistettuna alipuu on kopio toisesta tietovarastosta kun taas alimoduuli on vain viittaus toiseen tietovarastoon.[55]
Git käyttää nykyisin SHA-1-tiivistefunktiota tiedostojen seurantaan.[56] Git siirtyi versiossa 2.13.0 vahvennettuun SHA-1:een, joka ei ole haavoittuvainen vuonna 2017 julkaistulle SHAttered-hyökkäykselle.[57] Siirtyminen uudempaan SHA-2 standardiin on työn alla.[56][58]
Olioiden tallennus Gitissä on yksinkertaistettuna "vain" suunnattu syklitön verkko, jossa on kourallinen eri oliotyyppejä, joihin viitataan tiivisteellä.[59]
Git tallettaa tietoa useisiin objekteihin.[60] Tiedostoihin viitataan niiden sisällöstä lasketulla tiivisteellä.[60] Tiedoston siirtäminen eri hakemistoon tai sen nimen muuttaminen ei muuta sen tiivistettä, mutta hakemiston sisältöä luetteloivan hakemisto-objektin tiiviste muuttuu.[60] ”Commit”-objekti sisältää tietovaraston tilanteen tietyllä ajanhetkellä.[60] ”Commit”-objekti sisältää metatietoa kuten tekijän ja aikaleiman, tiivisteen hakemistopuusta sekä edellisen talletuksen tiivisteen (tai useamman talletuksen muutoksien yhdistämisen tapauksessa).[60] Näillä tiedoilla Git voi tuottaa tietovarastossa olevien tiedostojen tilan kullekin tallennukselle ja voi havaita mitä tietovarastossa on muuttunut.[60]
Muutos tiedoston sisältöön muuttaa sen omaa tiivistettä, tiedoston sisältävän hakemiston tiivistettä ja tietovaraston tilaan viittaavaa tiivistettä.[60]
Git tukee digitaalista allekirjoittamista ja sen tarkistamista GPG:llä.[61][60] Kehittäjät voivat allekirjoittaa yksittäisen muutoksen (commit -S
) tai koko tietovaraston tilan (engl. signed tag, tag -s
) ja tiivisteiden käytöllä havaitaan mikäli tietovarasto ei ole sama kuin on allekirjoituksella vahvistettu.[61][60]
Git ei itse käsittele käyttäjäoikeuksia, vaan siihen käytetään olemassa olevia työkaluja kuten SSH, tiedostojärjestelmän asetukset, käyttäjäoikeuslistat (ACL) ja muita tekniikoita.[62] Linux-ytimen versiohallinnassa käytetään gitolite-ohjelmaa oikeuksien hallintaan.[63]
Vertailussa GNU Bazaarin ja Mercurialin kanssa Git oli kertaluokkia nopeampi.[64]
Koska Git ei tarvitse verkkoyhteyttä muutoshistorian selaamiseen se on merkittävästi nopeampi kuin Subversion historian selaamisessa.[65]
Torvaldsin mukaan järjestelmän etuna on helpot ja luotettavat varmuuskopiot.[7] Gitiä on sanottu varmuuskopiointijärjestelmäksi itsessään ja käytetty muun muassa tietokannoille.[66][67]
Tietojen eheyden ja oikeellisuuden tarkistamiseen on git fsck
-komento.[68] Lisäksi git tekee taustalla useita asioita ylläpidollisiin tarkoituksiin.[69]
Suurien tietovarastojen kanssa toimintaan on lisätty osittainen kloonaaminen sekä "harva checkout" (git sparse-checkout
): näillä ominaisuuksilla haetaan paikalliseksi vain osa tietovaraston objekteista ja työkopiosta käytetään vain osa, joka on tyypillsesti rajattu tiettyihin alihakemistoihin.[70][71] Tyypillisesti tietovarasto Gitissä sisältää kaiken tiedon ja koko historian: osittaisella kloonilla voidaan rajata käyttö tiettyyn alihakemistoon.[72]
Suurien referenssimäärien (haarat ja tagit) käyttöä varten Gitiin on lisätty vaihtoehtoinen tallennusmuoto "reftable". Reftable nopeuttaa viittauksien hakua sekä tarkistamista, että objektiin on olemassa viittaus.[73][74][75]
Git integroituu useisiin ohjelmointiympäristöihin.[76][77][78] Microsoftin Visual Studio -kehitysympäristössä on tuki Git-versionhallinnalle.[79] libgit2 on linkitettävä kirjasto, jota voidaan käyttää muissa ohjelmissa Gitin ydintoiminnallisuudelle.[80]
Gitille on tehty useita graafisen käyttöliittymän sovelluksia.[81] Gitille on tehty myös SQL-rajapinta.[82] GitWeb on Gitin mukana tuleva verkkoselaimella käytettävä käyttöliittymä.[83] cgit on käytössä Linux-ytimen versiohallintapalvelimella.[84]
Tietovarastojen siirtämiseksi Subversionista Gitiin on olemassa muun muassa Eric S. Raymondin reposurgeon sekä git-svn työkalut.[85] Gitissä on eräitä valmiita komentoja tietojen hakemiseen muista järjestelmistä kuten Subversionista, Mercurialista, Bazaarista ja Perforcesta.[86][87]
Microsoft on julkaissut Git Virtual File System (GVFS) -projektin laajojen projektien hallintaan.[88][89] Projekti mahdollistaa osan lähdekoodeista näkyvän virtuaalisesti osana tietovarastoa (repository) varsinaisen latauksen tapahtuessa kun tiedostoa tarvitsee käsitellä.[88]
Nimi muutettiin muotoon VFS for Git jotta se ei sekoitu GNOME-projektin GVFS:n kanssa.[90]
Eclipse Foundationin mukaan Git oli käyttäjäyhteisössä tehdyn kyselyn perusteella suosituin versionhallintajärjestelmä vuonna 2014.[91] RhodeCoden mukaan Git oli vuonna 2016 usealla eri mittaustavalla selkeästi suosituin versionhallintajärjestelmä.[92] StackOverflow:n kyselyssä vuonna 2018 Git oli selkeästi suosituin versionhallintajärjestelmä.[93]
Gitin suosion syiksi sanotaan seuraavia:[94]
Gitiä on alettu vuoteen 2009 mennessä hyödyntää Linuxin ohella lukuisissa korkean profiilin ohjelmistohankkeissa kuten: Perl, GNOME, Qt, Samba, Kannettava tietokone jokaiselle lapselle ja Googlen Android-käyttöjärjestelmä. Vuonna 2020 GCC siirtyi käyttämään gitiä versiohallintaan.[95] Ars Technican mukaan Microsoft käyttää nykyisin Gitiä Windowsin lähdekoodien hallintaan.[96]
Hajautetun versionhallintajärjestelmän avulla kehitys on siirtynyt parempaan kehitysmalliin: Linux-ytimen kehitys on skaalautunut tuhansien ihmisten yhteiseen kehitystyöhön.[97]
Gitiä käyttäviä lähdekoodin isännöintipalveluita on useita, joista suosituimpiin kuuluvat:[98]
Vastaavan palvelun Gitin kanssa voi aloittaa itse käyttämällä ohjelmistoja kuten Phabricator, Jenkins ja GitLabin ohjelmisto.[98][99]
Gitiä on kritisoitu vaikeudesta, jota on parannettu kehittämällä työkaluja.[7][8] Vaikeuden on sanottu johtuvan joustavuudesta ja olevan joustavan järjestelmän synnynnäinen piirre.[100] Osa vaikeudesta on peräisin erilaisesta kokemustaustasta.[7]
Gitin mukana tulee suuri joukko työkaluohjelmia ja komentoja, joista pieni osa riittää normaalikäytössä.[97]
Gitin julkaisuissa vX.Y.0 ovat ”ominaisuusversioita” ja vX.Y.Z ”ylläpitoversioita”.[101] Ennen Gitin versiota v1.9.0 vX.Y.Z olivat ”ominaisuusversioita” ja vX.Y.Z.W ”ylläpitoversioita”.[101]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.