Homepage » Internet » Errore minimo, grave catastrofe - GitLab va offline per un giorno

    Errore minimo, grave catastrofe - GitLab va offline per un giorno

    GitLab, una startup che è un'alternativa al GitHub molto popolare, ha avuto un giorno piuttosto rude di recente l'errore umano ha causato l'interruzione dell'intero sito Web per un giorno intero.

    Il problema di GitLab è iniziato quando il il sito web stava riscontrando problemi di tempo di caricamento e stabilità. Il sito Web è stato portato offline per correggere i problemi. Tuttavia, durante la manutenzione, qualcuno ha involontariamente commesso l'errore di cancellare accidentalmente una directory contenente 300 GB di dati di produzione dal vivo.

    Fortunatamente per GitLab, i contenuti che sono stati solo eliminati problemi interessati e richieste unite. I repository e i wiki non sono stati influenzati da questo errore in alcun modo, nel senso che il il danno causato da questo errore non è stato così grave come avrebbe potuto essere

    Con la directory cancellata, il personale GitLab si gira immediatamente verso il suo backup. Sfortunatamente per loro, GitLab si è imbattuto in ancora un altro problema. Secondo il file di Google Doc che è stato costantemente aggiornato mentre GitLab fatica a tornare online, tutti i 5 backup / replica tecniche che il sito Web implementato non è riuscito a funzionare in modo affidabile, e in alcuni casi lo erano mai installato in primo luogo.

    Recupero di questi file persi dal cloud non è un'opzione per GitLab sia come l'avvio deciso alla fine dello scorso anno a scaricare il cloud per costruire e gestire i propri cluster Ceph. Inutile dire che GitLab sta ora riconsiderando la loro posizione su quel particolare argomento.

    @TheRegister @gitlab lavorerà per rendere l'applicazione più performante ed esplorare i provider di hosting cloud alternativi.

    - Connor Shea (@connorjshea) 1 febbraio 2017

    Nonostante il giorno tumultuoso di GitLab, il sito Web è ora attivo e funzionante come di consueto. Mentre il sito web ha riferito che alcuni dati sono stati persi durante una finestra di sei ore, il Git i repository sono rimasti incolumi durante l'intero calvario. Qui è possibile visualizzare un registro di tutti gli eventi dell'intero evento.

    Mentre molti le lezioni possono essere apprese dal piccolo errore di GitLab (principalmente hybris), il metodo di GitLab di gestire la crisi è piuttosto ammirevole come l'avvio è stato chiaro e trasparente con i suoi utenti. Ecco sperando che GitLab impari da questo errore. Altrimenti, la sua base di utenti sarebbe probabilmente meno indulgente se la storia si ripete.

    Fonte: il registro