Yapılandırılmış veri nedir?

Yapılandırılmış veriler, bir kayıt veya dosya içindeki sabit bir alanda bulunan herhangi bir veriyi ifade eder. Bu, ilişkisel veritabanlarında ve elektronik tablolarda bulunan verileri içerir.

Yapılandırılmış Verilerin Özellikleri

Yapılandırılmış veriler öncelikle, kaydedilecek iş verisi türleri ve bunların nasıl depolanacağı, işleneceği ve bunlara nasıl erişileceği konusunda bir veri modeli oluşturmaya bağlıdır. Bu, hangi veri alanlarının depolanacağını ve bu verilerin nasıl depolanacağını tanımlamayı içerir: veri türü (sayısal, para birimi, alfabetik, ad, tarih, adres) ve veri girişindeki herhangi bir kısıtlama (karakter sayısı; belirli terimlerle sınırlıdır, örneğin Bay, Bayan veya Dr olarak; M veya F).

Yapılandırılmış verilerin kolayca girilmesi, depolanması, sorgulanması ve analiz edilmesi avantajı vardır. Bir zamanlar, depolama, bellek ve işlemenin yüksek maliyet ve performans sınırlamaları nedeniyle, yapılandırılmış verileri kullanan ilişkisel veritabanları ve elektronik tablolar, verileri etkili bir şekilde yönetmenin tek yoluydu. Sıkı bir şekilde organize edilmiş bir yapıya sığmayan herhangi bir şey, bir dosya dolabında kağıt üzerinde saklanmalıdır.

Yapılandırılmış Verileri Yönetme

Yapılandırılmış veriler genellikle ilişkisel veritabanı yönetim sistemlerinde verileri yönetmek ve sorgulamak için oluşturulan bir programlama dili olan Yapılandırılmış Sorgu Dili (SQL) kullanılarak yönetilir. İlk olarak 1970'lerin başında IBM tarafından geliştirildi ve daha sonra ticari olarak Relational Software, Inc. (şimdi Oracle Corporation) tarafından geliştirildi.

Yapılandırılmış veriler, kesinlikle kağıt tabanlı yapılandırılmamış sistemlere göre çok büyük bir gelişmedir, ancak yaşam her zaman küçük kutulara sığmaz. Sonuç olarak, yapılandırılmış verilerin her zaman kağıt veya mikrofilm depolamayla desteklenmesi gerekiyordu. Teknoloji performansı artmaya devam ettikçe ve fiyatlar düştükçe, bilgi işlem sistemlerine yapılandırılmamış ve yarı yapılandırılmış veriler getirmek mümkün oldu.

Yapılandırılmamış ve Yarı Yapılandırılmış Veriler

Yapılandırılmamış veriler, kolayca sınıflandırılamayan ve düzenli bir kutuya sığdırılamayan her şeydir: fotoğraflar ve grafik görüntüler, videolar, akış aracı verileri, web sayfaları, PDF dosyaları, PowerPoint sunumları, e-postalar, blog girişleri, wiki'ler ve kelime işlem belgeleri .

Yarı yapılandırılmış veriler, ikisi arasında bir kesiştir. Yapılandırılmış bir veri türüdür, ancak katı veri modeli yapısından yoksundur. Yarı yapılandırılmış verilerde, verilerdeki belirli öğeleri tanımlamak için etiketler veya diğer işaretçiler kullanılır, ancak verilerin katı bir yapısı yoktur. Örneğin, kelime işlem yazılımı artık, yazarın adını ve oluşturulma tarihini gösteren, belgenin büyük kısmı yapılandırılmamış metin olacak şekilde meta verileri içerebilir. E-postalarda, e-posta mesajı içeriğinin ve herhangi bir ekin yapılandırılmamış verilerine gönderici, alıcı, tarih, saat ve diğer sabit alanlar eklenir. Fotoğraflar veya diğer grafikler, oluşturucu, tarih, konum ve anahtar kelimeler gibi anahtar kelimelerle etiketlenebilir, bu da grafikleri düzenlemeyi ve bulmayı mümkün kılar. XML ve diğer biçimlendirme dilleri genellikle yarı yapılandırılmış verileri yönetmek için kullanılır.

Yapılandırılmış Veri Teknolojisi Standartları

SQL, 1986'dan beri Amerikan Ulusal Standartlar Enstitüsü'nün bir standardıdır. Uluslararası Bilgi Teknolojisi Standartları Komitesi (INCITS) tarafından yönetilmektedir. Teknik Komite DM 32 Veri Yönetimi ve Değişim. Komitenin biri veritabanları diğeri meta veriler için olmak üzere iki görev grubu vardır. HP, CA, IBM, Microsoft, Oracle, Sybase (SAP) ve Teradata'nın tümü ve çeşitli federal devlet kurumları katılıyor. Her iki komite proje dokümanı, her proje hakkında daha fazla bilgi için bağlantılara sahiptir. SQL, 1987'de Uluslararası Standartlar Örgütü (ISO) standardı haline geldi. Yayınlanan standartlar şu adresten satın alınabilir: ANSI eStandards MağazasıINCITS / ISO / IEC 9075 sınıflandırması altında.