Binnen cloud computing is storage een issue. In de open-source wereld is echter een revolutionaire methode ontwikkeld om data in de cloud veilig te stellen: het storageplatform Ceph. SUSE heeft Ceph toegankelijk gemaakt. Tom D’Hont, Sales Engineer SUSE België en storage specialist legt uit hoe dat zit.

Wat is Ceph?
Ceph is een schaalbaar software-defined storagesysteem, ontwikkeld als open source project door een grote, actieve community. Ceph draait op standaard hardware in een netwerk en levert Object-, Block- en Filestorage in één zelfsturend en corrigerend platform, zonder single-point-of-failure. Met andere woorden, Ceph zorgt ervoor dat data altijd veilig staat. De data wordt namelijk gerepliceerd over meerdere machines. Bij uitval van een machine, zorgt Ceph er automatisch voor dat er weer voldoende replica’s van de data zijn,  terwijl alle data gewoon beschikbaar blijft. Ceph kent één nadeel: ben je geen geek, dan is implementatie en onderhoud een lastige klus.

SUSE voegt beheertool toe
SUSE is één van de organisaties die bij het Ceph-project betrokken is. De overname van openATTIC heeft SUSE in de gelegenheid gesteld om Ceph gebruiksvriendelijk en toegankelijk te maken. openATTIC is een open-source Ceph- en storagebeheertool dat door SUSE aan de community is  teruggegeven. Het project wordt nu door SUSE gesponsord en is gelicenseerd onder de GNU General Public License (GPLv2), volgens een volledig open ontwikkelingsproces.

SUSE vereenvoudigt het ingebruik nemen van Ceph door de toevoeging van DeepSea, een verzameling van Salt states, runners en modules voor het implementeren en beheren van een Ceph cluster.

Alles goed en wel, maar wat betekent Ceph voor mijn IT-omgeving?
Ceph is, zoals al eerder gezegd, een software-defined storagesysteem, dat gebruik maakt van Common Of The Shelf (COTS) servers, waarop een schaalbare storageoplossing wordt gebouwd die met de behoefte aan storage meegroeit. Het is een oplossing voor de groeiende behoefte aan opslagcapaciteit die wordt veroorzaakt door brede acceptatie van nieuwe technologieën zoals IoT, video voor marketing en surveillance en de extreme toename van gebruikersdata, veroorzaakt door BYOD en de bijbehorende eisen aan backup-ruimte.

Ondersteun innovatie
Verplaats je tier 2- en tier 3-opslag naar een software-defined storage-oplossing, dan kan je innovatie ondersteunen. Ongeveer 80% van de gegevens wordt namelijk geconsolideerd op één platform dat toegankelijk is via meerdere protocollen en interfaces. Alle gegevens die naar de Ceph-cluster zijn weggeschreven, worden als objecten opgeslagen. Je kan dit zelf doen door de Ceph RADOS-library (librados) in alle applicaties te implementeren en directe toegang tot de Ceph RADOS cluster toe te staan via C, C ++, Java, Python, Ruby of PHP. Vind je deze doe-het-zelf-aanpak te gewaagd, maar wil je je data toch graag als objecten aanspreken, dan kan je gebruik maken van een Ceph RADOS gateway, een zogenaamde bucket-based REST-gateway die met de standaard object storage protocollen S3 (Amazon) en Swift (OpenStack) compatibel is.

Block- & Filestorage
Is objectstorage nog een ver-van-je-bed show, er zijn ook opties voor Block- en Filestorage. Je kunt met het Ceph RADOS cluster communiceren via SCSI door gebruik te maken van het RADOS Block Device (RBD). Dit is een volledig distributed blockdevice, dat weinig opslag nodig heeft en in grootte kan worden aangepast. RBD maakt ook gebruik van RADOS-mogelijkheden zoals snapshotting, replicatie en consistentie. Je kan de RDB gebruiken met de Linux kernel client of de QEMU / KVM driver. Voeg een metadata server (MDS) toe aan het Ceph RADOS cluster en de mogelijkheid tot communicatie met het storagecluster op File-level is mogelijk. Ceph FS is een POSIX compliant en distributed file-systeem met Linux kernel client en ondersteuning voor Fuse.

Wil je nog meer interfaces?
SUSE ondersteunt meerdere andere scenario’s die de mogelijkheid bieden om met het Ceph cluster te praten. SUSE Enterprise Storage 4 ondersteunt officieel iSCSI en biedt een technologie preview voor NFS Ganesha, NFS toegang tot S3 buckets, CIFS Samba en RDMA/Infiniband. Alle technologiepreviews genieten een best-effort ondersteuning en zullen in de volgende versie een volledige productondersteuning krijgen.

Onmisbaar: Erasure Coding
De echte kracht van Ceph vind je in de Erasure Coding technologie. In plaats van het veiligstellen van data op meerdere schijven in één server, zoals bij RAID-technologie, realiseren we opslag van gegevens tussen opslagservers (verder aangeduid als OSD-nodes) met behulp van Erasure Coding. Met Erasure Coding definiëren we failure domeinen waarin we vastleggen wat we qua storingen aankunnen terwijl we het opslagcluster toch in de lucht kunnen houden.
 
Een failure domein kan een enkele OSD-node zijn, een rack van OSD-nodes of een volledig datacenter vol OSD-nodes. Neem een datacenter met 7 OSD-nodes: Erasure Coding setup van k = 5; m = 2 (5 data blocks + 2 parity blocks), 40% overhead (zoals bij RAID6). Het Failure domain is gelijk aan de OSD-node. We kunnen 2 volledige OSD-nodes verliezen en toch in de lucht blijven.

Een ander voorbeeld: een dubbele datacentersetup, 5 OSD-nodes in elk datacenter. Erasure Coding setup van k = 5; m = 5 (5 data blocks + 5 parity blocks), 100% overhead (zoals bij RAID 1). Failure domain staat gelijk aan een datacenter. We kunnen nu 5 OSD-nodes verliezen OF alle OSD-nodes van een datacenter en nog altijd in de lucht blijven

Meer weten?
De mogelijkheden die Ceph biedt zullen in de toekomst onmisbaar zijn voor het opslaan van data. SUSE Enterprise Storage 4 maakt door de toevoeging van handige tools Ceph gebruiksvriendelijk. Kijk voor meer informatie op www.suse.com/solutions/software-defined-storage/ of kom naar SUSECON, van 25 tot 29 september in Praag www.susecon.com. Gebruik code isrmdvsc17 voor 25% korting op je ticket.