- 전체
- Sample DB
- database modeling
- [표준 SQL] Standard SQL
- G-SQL
- 10-Min
- ORACLE
- MS SQLserver
- MySQL
- SQLite
- postgreSQL
- 데이터아키텍처전문가 - 국가공인자격
- 데이터 분석 전문가 [ADP]
- [국가공인] SQL 개발자/전문가
- NoSQL
- hadoop
- hadoop eco system
- big data (빅데이터)
- stat(통계) R 언어
- XML DB & XQuery
- spark
- DataBase Tool
- 데이터분석 & 데이터사이언스
- Engineer Quality Management
- [기계학습] machine learning
- 데이터 수집 및 전처리
- 국가기술자격 빅데이터분석기사
- 암호화폐 (비트코인, cryptocurrency, bitcoin)
NoSQL MongoDB : 기본 구조
2020.09.30 21:05
MongoDB : 기본 구조
DB internal structure
-
MongoDB의 데이터 저장소는 메모리 맵 파일(Memory Mapped File)을 사용한 가상 메모리를 사용한다
- MongoDB의 데이터 구조 : 데이터를 저장 : Record // 인덱스를 저장 : Bucket
- Record : BSON 객체를 저장하는 노드를 레코드로 정의, Record는 BSON 객체의 이중연결리스트 (double linked list)구조로 구성
- Bucket : 인덱스는 레코드에 저장된 데이터를 빠르게 찾기 위해 b-tree 형태로 저장된 노드 구조를 가짐
- b-tree 노드를 버켓(Bucket)이라고 정의
- Extent : MongoDB는 대용량 데이터를 HDD에 쉽게 저장할 수 있는 단위로 레코드들을 grouping한다.
- 이를 Extent라고 한다. Hadoop에서 chunk라고 하는 느낌이라고 생각하면 된다.
- Extent 들을 이용하여 MongoDB는 HDD에 저장될 파일과 삭제된 레코드를 관리한다.
- 자료 구조 관점에서 보면 연결되어 있는 Record들의 Header 역할을 수행하는 것
- 사용자가 하나의 데이터베이스를 만들었다면, MongoDB는 데이터베이스와 관련된 한 개의 네임스페이스(DB Namespace)를 만든다.
- DB Namespace == 컬렉션 (collection Namespace) + Free Extent 리스트(DB에서 삭제된 레코드 리스트를 가지고 있는 Extent 리스트)
- Collection Namespace는 primary index Namespace(B Tree)와 Record Extent list를 가진다. 그래서 MongoDB가 search가 빠른이유이다. primary index namespace에서 이진트리로 찾아내기 때문이다.
-
만약 Primary index 이외에 추가로 필드를 가지고 인덱스를 더 생성하면 B Tree 형태의 Index Namespace를 하나 더 가진다.
- Write(insert/update)를 수행할 때, MongoDB는 해당 레코드가 가리키는 가상 메모리 주소 공간에 데이터를 적재한다.
- Read를 수행할 때, MongoDB는 해당 메모리 주소 공간에 할당된 데이터가 가상 메모리에 로딩되어 있는지 확인하고, 없다면 파일에서 내용을 읽어 가상 메모리에 적재한다.
- MongoDB는 백그라운드로 (주기적으로)가상 메모리에 적재된 데이터를 HDD에 최대 2GB 단위로 파일을 구성한 볼륨(volume)으로 HDD에 데이터를 flush한다.
정리
- 처음 DB를 생성하면 DB Namespace가 형성이 되고, Collection Namespace와 Free Extent List가 형성이 된다. Collection Namespace는 primary index namespace 와 Record Extent list로 구성이 되어있다. Primary index namespace는 이진트리로 구성되어있어 굉장히 탐색이 빠르다. 따라서 다른 index로 search 하고 싶을 때는 index namespace를 하나 더 추가하면 된다.
- function, read을 작동하면 primary index namespace를 통해 search를 한다. 그리고 해당 record 주소 공간에 할당된 데이터가 있다면 불러오고, 아니면 file에서 content를 읽어와 가상 메모리에 적재를 한다.
- function, write를 작동하면 해당 record가 가리키는 가상메모리 주소 공간에 데이터를 적재한다.
출처 : https://nicewoong.github.io/development/2018/02/10/mongodb-internal/
출처: https://mambo-coding-note.tistory.com/339 [화학쟁이의 ㎚코딩도장]
본 웹사이트는 광고를 포함하고 있습니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.