알아봅시다 [알아봅시다] [잠깐과학]물리학자는 왜 월드와이드웹을 개발했을까
2020.11.22 00:54
[알아봅시다]
[잠깐과학]물리학자는 왜 월드와이드웹을 개발했을까
2020.11.14 10:00입자물리학 연구에서 가장 어려운 분야는 실험 후 해일처럼 밀려오는 데이터 홍수에서 원하는 정보를 찾는 과정입니다. 모래사장에서 모래알 하나를 찾는 일과 같습니다. 유럽입자물리연구소(CERN)에서 일하던 물리학자인 팀 버너스리가 웰드와이드웹(www)을 개발한 이유입니다.
‘데이터 보정’이라는 힘들고 고된 일
2015년 미국 상대론적 중이온가속기(RHIC)에서 입자 충돌 실험인 피닉스(PHENIX)에 참여하고 있을 때였습니다. 양성자를 서로 충돌시키면 나오는 ‘바텀 쿼크’가 한 번 더 붕괴해 나오는 입자를 찾아야 했습니다. 이 작은 입자는 양성자가 충돌한 지점에서 500μm(마이크로미터) 떨어진 곳에서 발생합니다. 이론적으로는 그렇습니다. 진짜 발견하려면 입자의 위치와 경로를 정확히 측정해야 합니다.
제가 입자를 검출하기 위해 사용했던 실리콘 검출기에는 작은 센서인 ‘픽셀’들이 모눈종이처럼 붙어 있습니다. 가로와 세로가 약 100㎛로 매우 작은 픽셀은 입자가 지나가면 신호를 보냅니다. 이 신호 정보로 입자들이 검출기를 지나며 마주친 픽셀들을 모으면 각 입자들의 경로를 알아낼 수 있습니다. 경로를 따라 각 입자가 처음 생겼던 곳을 추적해 가는데, 만약 입자의 시작점이 양성자 충돌 지점에서 수백㎛떨어져 있다면 바텀 쿼크가 붕괴하며 나온 입자라고 추정할 수 있습니다.
문제는 픽셀이 너무 작아 완벽하게 줄을 세우기 어렵다는 겁니다. 픽셀은 여러 개가 모여 한 층을 이루고, 이 층이 여러 개 모여 검출기를 이룹니다. 검출기가 입자의 경로를 정확히 측정하려면 각 층이 서로 뒤틀리지 않고 나란히 정렬돼야 하지만, 100㎛ 크기의 픽셀들이 정확히 정렬돼도록 검출기를 만들기는 불가능합니다 그렇다고 해서 1㎜ 라도 어긋나면 한 층을 지나간 입자가 다음 층에서는 엄청 멀리 떨어진 픽셀을 지나간 것처럼 측정될 겁니다.
이런 한계를 극복하기 위해 물리학자들은 픽셀들이 정확히 정렬되어 있지 않다고 가정하고, 실험 후에 컴퓨터로 데이터를 보정합니다. 픽셀 하나는 좌우, 위아래, 앞뒤로 이동할 뿐만 아니라 회전할 수도 있어 모든 변수를 고려해 계산합니다. 이 작업은 시간이 매우 오래 걸려 저도 2년간 보정 작업을 거친 후에야 원하는 입자를 찾을 수 있었습니다.
가속기에서 영화 10만 편에 달하는 데이터가 쏟아진다
여행지에서 무심코 사진을 찍으면 어느새 카메라에 저장 공간이 부족하다는 경고 메시지가 뜹니다. 사진의 해상도가 올라갈수록 용량이 커져 더 많은 저장 공간이 필요합니다.
이와 같은 일이 가속기 실험에서도 일어납니다. 입자 충돌 실험에서 발생하는 입자는 검출기를 지나면서 마주치는 픽셀에 흔적을 남기는데, 이 신호를 저장하는 것이 사진을 찍는 것과 같습니다. 사진처럼 검출기도 픽셀이 많아질수록 정밀해집니다. 그럴수록 저장해야 할 데이터량도 많아집니다.
실리콘 검출기 중에서는 가로와 세로의 길이가 각각 3㎝ , 1.5㎝인 칩 하나에 픽셀이 약 50만 개나 있는 것도 있습니다. 이런 실험에서 저장하는 데이터는 1년에 1PB(페타바이트) 이상인데, 1PB는 요즘 컴퓨터에 사용되는 하드디스크의 용량인 1TB(테라바이트)의 약 1000배입니다. 용량이 10GB(기가바이트)인 초고화질 영화 십만 편에 해당하는 어마어마한 크기입니다.
방대한 데이터를 저장하고 처리하려면 컴퓨터도 많이 필요합니다. RHIC의 컴퓨터에는 중앙처리장치(CPU)가 약 3만 개 달려있습니다. CPU가 하나만 있다면 데이터를 처리하는 데 1달 정도 걸릴 것을, 3만 개를 동시에 작동시켜 몇 분만에 끝내는 겁니다. 전 세계 약 천 명의 연구자들이 이 컴퓨팅 시설에 접속해 충돌 실험 데이터를 분석합니다.
물리학자가 www를 만든 이유
유럽입자물리연구소(CERN)의 컴퓨팅 시설은 더 독특합니다. 처리하는 데이터량에 비해 연구소 안에 컴퓨터가 많지 않습니다. 이는 데이터가 세계 곳곳에 나뉘어 있기 때문입니다. 여러분도 크롬 같은 웹브라우저에 웹사이트 주소를 입력할 때 앞에 ‘www’가 붙는 걸 본 적이 있을 겁니다.
‘www’는 URL이라는 고유한 주소를 이용하는 정보 검색 시스템입니다. CERN에서 개발됐습니다. CERN은 1980년대까지 데이터를 여러 컴퓨터에 나눠 저장하는 바람에 하나의 정보를 찾으려면 수많은 컴퓨터를 뒤져야 했습니다. 그러다 보면 있는 정보도 잘 찾을 수 없었습니다.
CERN에서 물리학을 연구하던 팀 버너스리 연구원은 1989년 3월 www를 고안했습니다. 여러 컴퓨터에 나뉜 정보에 각각 주소를 지정해 쉽게 검색하도록 한 것입니다. 도서관이 각 책에 위치 코드를 달아 분류하는 것 처럼요. www를 이용하면 CERN 밖에 있는 물리학자들도 정보를 빠르게 교환할 수 있어 공동 연구가 가능해졌습니다. 이후 일반 사용자도 쉽게 사용할 수 있는 웹브라우저가 개발되면서 지금과 같은 인터넷 환경이 만들어졌습니다.
2008년부터 CERN은 전 세계의 컴퓨터를 하나로 묶은 ‘WLCG’라는 시설을 구축해 왔습니다. 전 세계 42개 국가의 170여 개 컴퓨팅 시설에 데이터를 나누어 저장합니다. WLCG에는 매년 10PB 이상의 데이터가 새로 저장돼 전 세계 약 만 명에 가까운 연구자들이 이용합니다. 한국의 기초과학연구원도 WLCG에 속하는 덕에 국내 연구원도 거대강입자가속기(LHC)에서 이뤄지는 실험에 참여할 수 있습니다.
※관련기사
어린이과학동아 23호(11월 15일 발행) [헥!헥! 핵물리학자] 요건 몰랐지? www는 물리학자가 개발했다
※필자소개
임상훈 부산대학교 물리학과 교수. 고에너지 핵물리학을 연구한다. 미국의 상대론적 중이온 가속기(RHIC)와 유럽의 거대 강입자 가속기(LHC)에서 각각 피닉스(PHENIX) 실험과 앨리스(ALICE) 실험에 참여한다.
- 임상훈 부산대 물리학과 교수 shlim@pusan.ac.kr
[출처] http://dongascience.donga.com/news.php?idx=41423
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.