Dosya Organizasyonu (File Organisation)

SimHash (Benzerlik Özeti)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle metin işlemenin yoğun olduğu, arama motoru gibi uygulamalarda dosyaların veya web sitelerinin birbirine olan benzerliğini bulmak için kullanılan bir algoritmadır. Algoritmaya alternatif olarak klasik hash fonksiyonları kullanılabilir. Yani, örneğin iki sayfasnın ayrı ayrı hash değerleri alınıp bu değerleri karşılaştırmak mümkündür. Ancak simhash algoritması, bu yönteme göre daha [...]

Doğrusal Karım (Linear Hashing)

Yazan : Şadi Evren ŞEKER Bu yazının amacı, doğrusal karım ve doğrusal karım tablosu (linear hash table) konularını anlatmaktır. Bilgisayar bilimlerinde veri depolamak veya veriye hızlı ulaşmak için kullanılan yöntemlerdir. Doğrusal karım yönteminde temel olarak özetleme fonksiyonları kullanılır (karım fonksiyonu, hash function). Bu fonksiyonlar sıralıdır ve sayısı, özetleme fonksiyonunun seviyesini belirtir. (h1, h2, h3, … [...]

Şadi Evren ŞEKER tarafından, 01/04/2011 tarihinde yazıldı. | Dosya Organizasyonu (File Organisation) | A yorum var

2-3-4 Ağaçları (2 3 4 trees)

Yazan : Şadi Evren ŞEKER 2-3-4 ağacı, B-ağaçlarının (B-Trees) özel bir halidir. Bu ağacın özelliği, düğüm boyutunun (node size) 3 ile sınırlı olmasıdır. Ağaç ayrıca sürekli olarak dengeli bir ağaç garantisi verir (balanced tree). 2-3-4 ağaçları, kırmızı siyah ağaçlarının (red-black trees) , eş şekillisi (isomorphic) olarak da düşünülebilir. 2-3-4 ağacının ismi, ağaçtaki düğümlerin değişik durumlarda [...]

CCI (Computed Chaining Insertion, Hesaplamalı Zincir Eklemesi)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme fonksiyonu (hashing function) sonucunda, çalışma olması durumunda (collision), dizi üzerinde farklı bir adrese çakışan sayı konulur veya aranır. Bu farklı sayı için ikinci bir özetleme fonksiyonu kullanılır. Buraya kadar olan tanım, [...]

RAID (Redundant Array of Independent Disks)

Yazan :Şadi Evren ŞEKER Bilgisayar bilimlerinde, depolama yönetimi (storage management) için kullanılan yöntem standardıdır. Kaynaklarda redudant array of independent disks ( fazladan bağımsız disk dizisi ) şeklinde geçtiği gibi , redundant array of inexpensive disks ( ucuz disklerin fazlalık dizisi) olarak da geçmektedir. Kısaca bu standart çeşitli seviyelerde verinin fazladan bir kopyasının tutulması ile birlikte [...]

Doğrusal Bölüm (Linear Quotient)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir çakışma durumu olduğunda, eklenecek olan anahtarı kaç sıra sonraya yerleştireceğimizi bulan ikinci bir özetleme fonksiyonu kullanılır. Kullanılan ikinci özetleme fonksiyonu ise sayının bölümüdür: H1 : K mod n H2 : K / [...]

LICH (Last Insertion Coalesced Hashing)

Yazan : Şadi Evren ŞEKER Türkçeye, son ekleme birleştirme özetlemesi olarak çevrilebilir. Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme alanını iki parçaya ayıran bu algoritmada amaç çakışma sonucu oluşan alanlar ile doğru adreste indekslenen verilerin ayrılmasıdır. Kabaca aşağıdaki şekil gibi düşünebiliriz: Yukarıdaki şekilde [...]

EISCH (Early Insertion Standart Coalesced Hashing)

Yazan : Şadi Evren ŞEKER Türkçeye, erken ekleme standart birleştirme özetlemesi olarak çevrilebilir. Bilgisayar bilimlerinde, özellikle dosya yönetimi konusunun (file organization) kullandığı bir özetleme (hashing) çakışması (collision) çözüm algoritmasıdır. Basitçe bir özetleme fonksiyonu (hashing function) sonucunda, çalışma olması durumunda (collision), dizinin sonundan başa doğru boş bulunan ilk yere yerleştirmeyi söyler. Bu durumu bir örnek üzerinden [...]

Çift Özetleme (Double Hashing)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde kullanılan özetleme fonksiyonları, genellikle büyük bir verinin daha küçük bir hale getirilmesine yarar. Bu anlamda özetleme fonksiyonları veri doğrulama (data verification) , veri bütünlüğü (data integrity), veri güvenliği (security) ve şifreleme (encryption) gibi pek çok alanda kullanılırlar. Özetleme fonksiyonlarının bir problemi, büyük bir veriyi özetledikten sonra, çakışma olması [...]

İkinci Dereceden Sondalama (Quadratic Probing)

Yazan : Şadi Evren ŞEKER Özellikle özetleme fonksiyonlarının (hashing functions) bilgileri sınıflandırması sırasında kullanılan formülün ikinci dereceden olması durumudur. Özetleme fonksiyonlarında, sık kullanılan doğrusal sondalama (linear probing) yönteminin tersine, bir bilgiyi tasnif ederken, ardışık olarak veriler üzerinde hareket etmez, bunun yerine her defasında baktığı uzaklığı ikinci dereceden bir denklem ile arttırır. Konuyu anlamaya öncelikle doğrusal [...]

Turing Makinesi (Turing Machine)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinin önemli bir kısmını oluşturan otomatlar (Automata) ve Algoritma Analizi (Algorithm analysis) çalıştırmalarının altındaki dil bilimin en temel taşlarından birisidir.1936 yılında Alan Turing tarafından ortaya atılan makine tasarımı günümüzde pekçok teori ve standardın belirlenmesinde önemli rol oynar. Turing Makinesinin Tanımı Basitçe bir kafadan (head) ve bir de teyp bandından [...]

fstream (File Stream, Dosya Akışı)

Yazan : Şadi Evren ŞEKER Özellikle C++ dilinde dosyalara erişmek ve dosyalar üzerinde işlem yapmak için çeşitli fonksiyonlardan oluşan bir kütüphanenin ismidir. Aslında bilgisayarlardaki giriş çıkış işlemlerini ( I/O input/output) dört ana başlıkta toplamak mümkündür. Standart giriş çıkış işlemleri (klavye ve ekran) (Standard input output) Dosya giriş çıkış işlemleri (İşletim sisteminin dosya yapısındaki bir dosyadan [...]

Şadi Evren ŞEKER tarafından, 20/04/2009 tarihinde yazıldı. | C/C++, Dosya Organizasyonu (File Organisation) | 18 yorum var

Atomluluk (Atomicity)

Yazan: Şadi Evren ŞEKER Latince bölünemez anlamına gelen atom kökünden üretilen bu kelime, bilgisayar bilimlerinde çeşitli alanlarda bir bilginin veya bir varlığın bölünemediğini ifade eder. Örneğin programlama dillerinde bir dilin atomic (bölünemez) en küçük üyesi bu anlama gelmektedir. Mesela C dilinde her satır (statement) atomic (bölünemez) bir varlıktır. Benzer şekilde bir verinin bölünemezliğini ifade etmek [...]

Gizli Dosya (Hidden File)

Yazan : Şadi Evren ŞEKER İşletim sistemlerinde kullanılan dosya tiplerinden birisidir. Basitçe sistemde kullanılan kritik dosyaların kullanıcı müdahalesinden korumak için geliştirilmiştir. Örneğin Windows™ işletim sisteminde kullanılan gizli dosyaların ağırlıklı amacı sistem dosyalarını ve önemli ayarlamaları içeren klasörleri korumaktır. Linux / Unix gibi işletim sistemlerinde de gizli dosyaların isimleri “.” işareti ile başlamaktadır. İşletim sistemi otomatik [...]

Sonda (Probe)

Yazan : Şadi Evren ŞEKER Veri iletişimi sırasında veriye erişmek için yapılan her bir erişim işlemine verilen isimdir. Örneğin veri diskte veya hafızada duruyor olsun, veriye erişmek için yapılan her bir hafıza veya disk erişimine sonda ismi verilir. Basit bir dizide veriyi aradığımızı düşünelim. Örneğin dizimiz: int a[] = { 2 ,3 ,8 ,7}; olarak [...]

Patricia ağacı (PATRICIA Tree)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde sıkça kullanılan TRIE ağacının özel bir hali olan patricia ağacında genellikle sözlüksel olarak (lexiconically) veriler tutulur. Radix ağacı (radix tree) ve farklı ikil ağacı (crit bit tree) ile oldukça benzer olan patricia ağacının, TRIE ağacından en büyük farkı tutulan verilerin ortak olan noktalarından sonra farklılaşılan yönlerine göre dallanma [...]

Brent Yöntemi (Brent’s Method)

Yazan : Şadi Evren ŞEKER Bilgisayar bilimlerinde dosya yönetiminde özetleme (hashing) için kullanılan bir yöntemdir. Bu yönteme göre ekleme sırasında bazı değişiklikler ile yerleştirilen kayıtların arama hızını arttırmak ön plandadır. Özet tabloya (hash table) yerleştirilen bir kayıdın çeşitli durumlarda yeri değiştirilerek okuma zamanının arttırılması hedeflenir. İki ayrı zincir tutmaktadır. Birincil sonda zincirinde (primary probe chain) [...]

B Ağacı (B-Tree)

Yazan : Şadi Evren ŞEKER İçerik 1. B-Ağacının Tanımı 2. Örnek B-Ağacı 3. B-Ağacında Arama 4. B-Ağacına Ekleme 5. B-Ağacından Silme İsminin nereden geldiği (B harfinin) tartışmalı olduğu bu ağaç yapısındaki amaç arama zamanını kısaltmaktır. Buna göre ağacın her düğümünde belirli sayıda anahtar veya kayıt tutularak arama işleminin hızlandırılması öngörülmüştür. Arama hızının artmasına karşılık silme [...]

Özetleme Fonksiyonları (Hash Function)

Yazan : Şadi Evren ŞEKER Özetleme fonksiyonlarının çalışma şekli, uzun bir girdiyi alarak daha kısa bir alanda göstermektir. Amaç girende bir değişiklik olduğunda bunun çıkışa da yansımasıdır. Buna göre özetleme fonksiyonları ya veri güvenliğinde, verinin farklı olup olmadığını kontrol etmeye yarar ya da verileri sınıflandırmak için kullanılır. Anlaşılması en basit özetleme fonksiyonu modülo işlemidir. Buna [...]