none
Tip: WinFS(Windows Future Storage Services) RRS feed

  • 일반 토론

  •  
     
    마이크로소프트의 차세대 파일시스템인 winFS 베타1이 공개된지도 시간이 좀 되었습니다. 좋은 소식은 winFS RTM버전은 윈도우 비스타 뿐만 아니라 XP에서도 설치가 가능하다고 합니다. WinFS를 한마디로 정의하자면 파일시스템위에 관계형 DB 엔진을 연동시켜서 다양한 형식의 데이터 검색 도구입니다. 예들 들어서 "내가 한달안에 만난 사람들에게 받은 이메일중에서 아직 답장을 보내지 않은 이메일 메세지좀 보여줘" 이런식의 질의가 가능하다는 것입니다.
    WinFS 파일시스템 내에서는 문서파일, 사진, 동영상, 이메일, 연락처 등 모두 하나의 연관된 데이터 덩어리입니다. 기존 파일시스템처럼 폴더 형태로 관리를 하는게 아니란 것입니다. 그리고 MS의 장점인 완벽한 하위 호환성을 보장 합니다. WinFS 이전에 작성된 legacy software들도 완벽하게 WInFS위에서 동작 한다는 것입니다. 또한, WinFS를 사용하더라도 유닉스, 리눅스등 이기종간의 호환성도 보장합니다.

     
     
    무엇보다 눈길을 끄는건 WInFS Life Journal 이라는 WINFS GUI용 브라우져 입니다. 아직 Prototype 이라 정식버젼에서 어떤식으로 변할진 모르겠지만 꽤 괜찮아 보입니다. 화면을 보시면 아시겠지만 WinFS 안의 모든 데이터들을 폴더가 아닌 저런 막대형태의 그래프로 보여줍니다. 데이터를 timeline 순으로, 아니면 카테고리 형식으로 분류해서 관리를 하게 되는 것입니다. 잘 이해가 되지 않으신다면 아래 HyperLink 동영상을 보시면 좀더 이해하시기 쉬울 것입니다.

    더욱 잼있는건 데이터간의 관계를 어려운 SQL문이 아닌 마우스클릭 몇번만으로 관계를 맺어 줄수있다는 것입니다. 그런데 하나 의문이 드는건 WInFS를 운영하기 위해서 어느정도의 오버헤드가 발생하는지 궁금합니다. 정확한 테스트 값은 정식 버전이 나오면 알게 되겠지요^^
     
    정보의양이 너무 많아지다보니 보다 획기적인 다양한 데이터 관리 방법이 생겨나고 있습니다. Microsoft의 WinFS, 개인적으로 상당히 기대되는 기술 중 하나입니다. 
     
     
    아래는 Microsoft SQL Server Group 책임자, Tomas Rizzo의 2004년 3월 17일 '새 Windows File System 소개' 컬럼입니다. WinFS 에 대한 정의와 기술 개념에 대하여 보다 깊게 접근할 수 있는 좋은 자료인 것 같아 덧붙입니다.
     

    WinFS 101: 새 Windows 파일 시스템 소개

    Thomas Rizzo
    Microsoft Corporation

    2004년 3월 17일

    요약: Tom Rizzo가 새 "Longhorn" 저장소 하위 시스템(코드 이름: "WinFS")이 필요한 이유, WinFS에서 데이터 오버로드 문제를 해결하는 방법 및 앞으로 여러 달에 걸쳐 칼럼에서 연재할 내용에 대해 간략하게 설명하면서 새 칼럼을 시작합니다(5페이지/인쇄 페이지 기준).

    새 칼럼 WinFS 파일로 만나게 되어 기쁩니다! 이 칼럼은 "Longhorn"이라는 코드 이름의 Microsoft Windows의 다음 릴리스에 추가할 예정인 혁신적 기술, 특히 코드 이름이 "WinFS"인 혁신적 새 파일 시스템에 대한 상세한 내용을 개발자가 이해하는 데 도움을 주기 위한 것입니다. 이 연재 칼럼에서는 WinFS의 데이터 모델, 기능 집합 및 프로그래밍 패러다임을 살펴 봅니다. 이 첫 번째 칼럼에서는 WinFS의 새로운 내용 및 새 기술의 학습 및 이해를 시작하는 방법에 대해 간략하게 설명합니다.

    WinFS가 필요한 이유

    기술 산업 분야에서는 정보 개발 및 작업 방식의 비약적 도약을 가능하게 하는 경향과 기술이 조합된 "혼란 현상" 증가하고 있습니다. 이러한 현상은 하드웨어 발전, 디지털화된 데이터의 양적 증가 및 급격히 증가하는 정보 관리의 스키마 및 표준이라는 3가지 요인으로 구성되어 있습니다.

    하드웨어 발전

    지난 몇 년 동안의 하드웨어 발전을 살펴 보면 특정 유형의 하드웨어가 급격히 성장했음을 알 수 있습니다. 칩의 트랜지스터 수가 18개월마다 두 배로 증가한다는 무어의 법칙은 널리 알려져 있습니다. 하지만 많은 사람들이 네트워크 대역폭 및 저장소 기술은 무어의 법칙에서 제시한 속도보다 훨씬 빠르게 발전하고 있다는 사실은 잘 알지 못합니다. 가정에서 전 세계 네트워크에 연결하는 개인은 물론, 기업 내부에서도 네트워크 대역폭은 급속도로 성장하고 있습니다. 저장소는 지난 수십 년 동안 서버 및 클라이언트 컴퓨터에서 모두 크게 향상되었습니다. 1984년에 10메가바이트의 하드 디스크가 IBM PC에 도입되었습니다. 현재 랩톱 컴퓨터는 60-80기가바이트의 하드 드라이브가 표준으로 제공됩니다. 앞으로 몇 년 후에는 랩톱 컴퓨터에 1테라바이트 이상의 저장소가 있는 것도 불가능하지 않습니다. 저장소가 이와 같은 속도로 성장하면서 사용자가 매일 만들고 저장하고 검색한 모든 데이터를 관리해야 하는 문제도 발생합니다.

    디지털화된 데이터

    오늘날, 작업하는 대부분의 데이터는 디지털화됩니다. 이 기사 역시 지면이 아닌 랩톱 컴퓨터에서 Microsoft Word로 작성되었습니다. 현재 전자 메일, 전자 팩스, 디지털 미디어, 달력, Microsoft Office 문서, 음성 메일 및 기타 다양한 유형의 정보가 전자적으로 만들어져 저장됩니다. 실제로 2003년 University of Berkeley study(영문)에 따르면 2002년에 5백만 테라바이트 또는 5엑사바이트의 새 정보가 만들어졌습니다. 해당 정보의 92%가 자기 미디어(주로 클라이언트 하드 디스크)에 저장되었습니다. 2002년에 40만 테라바이트의 전자 메일이 전송 및 저장되었습니다. 하드웨어 및 소프트웨어의 향상된 성능과 이전보다 훨씬 많은 정보를 연결, 다운로드, 처리 및 저장하는 컴퓨터의 기능을 모두 감안할 때, 직접 만들었거나 다른 사람에게서 받은 디지털 데이터를 효율적으로 관리하는 것이 얼마나 중요한지 알 수 있습니다.

    데이터 표준 및 스키마화된 데이터

    데이터 표준 및 스키마화된 데이터의 급증은 새로운 정보 관리 방법을 고안하는 데 있어 마지막 난제입니다. 지난 수십 년 동안 디지털 데이터로 전환하는 과정에서 대부분의 기업 및 업계 그룹이 실제 비즈니스 프로세스 이후에 데이터를 모델링하고자 했습니다.

    처음에는 많은 비즈니스 프로세스의 복잡한 모델링 및 자동화를 컴퓨터가 처리하지 못했습니다. 그러나 컴퓨터 속도, 프로그래밍 언어 및 데이터 기술이 향상되었고, 특히 ERP(Enterprise Resource Planning), CRM(Customer Relationship Management), SFA(Sales Force Automation) 및 기타 유형의 엔터프라이즈 응용 프로그램이 등장하면서 비즈니스 프로세스 자동화를 통해 기업에서 작업을 단순화할 수 있게 되었습니다. 이러한 새로운 유형의 응용 프로그램으로 인해 데이터는 급속히 복잡해졌지만 동시에 비즈니스에 보다 유용한 더욱 뛰어난 구조를 갖게 되었습니다. 불투명 이진 데이터 또는 단순 데이터 모델을 저장하는 대신에 데이터베이스 시스템에서 서로 다른 유형의 복잡한 데이터를 연계할 수 있었습니다. 예를 들어, ERP 시스템은 복잡한 일반 회계 원부, 인적 자원 및 영업 시스템을 인식하여 모델링할 수 있습니다. 표준화된 스키마가 시스템 데이터에 대해 설명을 제공한 이후, 기업은 비즈니스에 대한 관심 있는 질문을 하고 시스템에 해당 정보를 쿼리할 수 있게 되었습니다.

    그러나 시스템 간 작업은 여전히 업계의 문제입니다. 기업 내 시스템을 통합하는 것도 어려운 작업이며, 기업 간 시스템을 통합하는 작업은 훨씬 더 어렵습니다. 이는 다른 유형의 시스템 간에 스키마화된 데이터를 고객이 탐색할 수 있도록 하는 EAI(Enterprise Application Integration) 공급업체가 성장하는 계기가 되었습니다. 이와 같은 통합 문제를 인식하면서 업계에서는 회사가 여러 시스템 및 여러 조직 간 작업을 수행하는 데 도움이 되는 방법으로 XML 및 XML Web Service를 채택하게 되었습니다. 이러한 새 표준은 데이터 통합 문제를 해결하고 전체 조직 및 여러 조직이 데이터를 공유할 수 있도록 합니다.

    WinFS의 정의

    이와 같은 기술적 혼란 현상에 대비하기 위해 Microsoft는 코드 이름이 WinFS인 차세대 Windows 파일 시스템을 구축하는 데 많은 투자를 했습니다. WinFS 제품 팀은 Windows 파일 시스템을 다시 발명할 때 정보 검색 지원, 정보 연계 지원 및 정보에 따른 작업 수행 지원 등 3가지 핵심 원칙을 준수했습니다. 먼저 각 원칙의 의미를 살펴 보고 WinFS에서 이러한 목표를 충족할 수 있도록 하는 기술에 대해 자세히 설명하겠습니다.

    검색

    마케팅 및 정보 기술 조사 회사인 IDC에 따르면 정보 근로자는 작업 시간의 약 15-30%를 정보를 찾는 데 소비합니다. 8시간 근무하는 일반적인 근무 환경에서는 1시간에서 2시간 30분 동안 정보를 검색한다는 계산이 나옵니다. IDC는 또한 웹 검색 중 적어도 50%가 실패한다고 추정합니다. 더 나은 검색 엔진이 되는 것이 아닌 정보 검색 속도 및 정확도를 개선하는 것이 WinFS의 주요 목표 중 하나입니다. 정보 검색은 콘텐츠를 탐색 및 인덱싱하는 것에 그치지 않습니다. 오히려 오늘날의 정보는 WinFS에서 그 기능을 제공하는 정보 간 관계 정의 등 많은 의미를 보유하고 있습니다. WinFS 사용자는 대부분의 정보를 찾는 기본 방법으로 검색을 사용하지 않게 될 것입니다.

    또한 파일 시스템 기술에는 지난 10년 동안 큰 변화가 없었습니다. 멀티미디어와 새로운 유형의 의사 소통 및 공동 작업 등 이진 파일의 범위를 벗어난 데이터 및 간단한 메타데이터의 새로운 유형이 나타났습니다. 현재 파일 시스템은 이와 같은 새 데이터 유형에서 정보를 수집하고 검색하는 방법을 제공하지 않습니다. 그러나 Microsoft는 이 새 정보 유형이 포함되도록 파일 시스템을 확장하고 정보 작업을 위한 더 많은 기능을 제공하는 WinFS를 구축하고 있습니다.

    연계

    누구나 데이터에 존재하는 관계에 대해 알고 있습니다. 그러나 현재 소프트웨어는 이러한 관계를 제대로 저장하거나 활용하지 않습니다. 예를 들어, 어떤 회의에서 George라는 사람이 특정 문서에 대해 토의했다고 가정해 봅시다. 이때 George가 해당 문서를 작성했으며 George가 또 다른 흥미로운 문서를 작성했다는 사실을 알고 있다고 합시다. 만약 현재 상황에서 그 다른 문서를 찾으려면 전자 메일, 파일 시스템 및 즐겨 찾는 곳을 모두 검색해야 합니다. WinFS에서는 직접 작성하는 사용자 지정 응용 프로그램 데이터를 포함하여 서로 다른 데이터 유형모두 연결하여 데이터 관계를 시스템에 구축합니다. 사용자는 이러한 관계를 통해 더욱 다양한 방식으로 데이터를 탐색할 수 있습니다. 또한 자신의 응용 프로그램, 다른 사람의 응용 프로그램 또는 기본 제공 Windows 프로그램 등 데이터를 저장한 위치에 상관없이 데이터의 상호 적합성 정도를 사용자가 보다 잘 이해할 수 있도록 WinFS를 인식하는 응용 프로그램에서 이러한 관련 항목을 그래픽으로 표시할 수 있습니다.

    작업 수행

    지금까지 모든 데이터를 WinFS에 저장하여 새롭고 훨씬 직관적인 방식으로 해당 데이터에 대한 관계를 만드는 방법에 대해 설명했습니다. 그러나 이것이 이 시스템으로 수행할 수 있는 작업의 전부라면 WinFS를 혁신적 시스템이라고 말할 수 없을 것입니다. 사용자가 모든 데이터 시스템에서 필요로 하는 한 가지 주요 기능은 데이터를 작업 가능한 유용한 정보로 변환할 수 있도록 하는 시스템 기능입니다. 대부분의 PC 사용자는 데이터를 디지털화하는 데 많은 시간을 소비합니다. 데이터 정렬, 필터링, 범주화 및 우선 순위 지정 작업을 직접 수행해야 합니다. WinFS는 사용자가 디지털 작업을 직접 수행하지 않고 디지털 데이터에 대한 의사 결정만 하도록 하는 디지털 에이전트를 제공합니다. WinFS는 주로 자동화 가능한 번거로운 데이터 작업을 없애는 방식으로 정보 오버로드를 해소하게 됩니다. 관련이 있거나 중요한 정보만 데이터 사용자에게 버블링해야 합니다.

    예를 들어, 즉시 응답이 필요한 특정 비즈니스 문서를 작업 중일 때 이와 관련하여 작성자가 전자 메일을 보낼 시간을 알고 싶은 경우가 있습니다. 그러나 사용자는 사무실에 있지 않고 회의에 참석 중이므로 휴대폰으로 통화만 가능합니다. 전자 메일을 놓치지 않고 가능한 한 빠른 시간 내에 해당 작성자와 의견을 교환해야 합니다. 그러려면 당일 내에 제출해야 하는 비즈니스 문서의 문제점을 철저하게 논의하기 위해 30분 간의 전화 브리핑을 설정해야 합니다.

    WinFS 규칙은 시스템의 데이터 작업, 정렬 및 전달 방법을 지정할 수 있는 기능을 제공하는 기본 제공 시스템 구성 요소입니다. WinFS 규칙을 사용하여 데이터 및 데이터 관계에 적용되는 규칙을 만들 수 있습니다. 또한 WinFS 규칙은 다른 Windows 응용 프로그램에도 적용되어 사용자에게 알림(예: 휴대폰으로 페이지 전송)을 제공할 수도 있습니다 . 마지막으로, WinFS 규칙을 사용하면 달력 정보에서 해당일의 여유 시간을 검색하여 휴대폰 회의를 예약할 수 있습니다. 여기서 해당 규칙은 자동으로 다음 여유 시간에 회의를 만들 수 있습니다. 통합된 WinFS 규칙 기술을 사용하면 WinFS에 저장했거나 복제한 데이터를 활성 데이터로 만들 수 있습니다. 이 활성 데이터는 중요한 정보가 시스템에 입력되는 즉시 사용자에게 알려 주므로 보다 나은 비즈니스 결정을 할 수 있도록 합니다. 이 기술은 현재 수동으로 수행하는 대부분의 데이터 작업을 자동화하여 정보 오버로드를 해소합니다.

    기술 설명

    WinFS의 기반이 되는 철학에 대해 설명했으므로 이제 몇몇 핵심 기술에 대해 설명하겠습니다. 이 첫 칼럼에서는 각 기술에 대한 수준 높은 개요를 제공합니다. 향후 몇 개월 동안 이 칼럼에서는 각 영역을 심도 있게 살펴 보고 개발자가 새 WinFS 기술로 응용 프로그램을 구축하는 방법을 설명할 예정입니다.

    기술 측면에서 WinFS는 핵심 WinFS, 데이터 모델, 스키마, 서비스 및 API 등 5가지 구성 요소로 이루어져 있습니다. 그림 1에서 이러한 구성 요소의 빌딩 블록을 자세히 볼 수 있습니다.

    그림 1. 핵심 WinFS 빌딩 블록

    핵심 WinFS

    핵심 WinFS는 파일 시스템에 일반적으로 포함되는 핵심 서비스로 구성되어 있습니다. 핵심 WinFS는 작업 및 파일 시스템 서비스를 포함하는 기본 항목으로 간주할 수 있습니다. 보안, 관리 효율성, Win32 파일 액세스 지원, 가져오기/내보내기, 할당량 등을 예로 들 수 있습니다.

    데이터 모델

    핵심 서비스보다 넓은 개념인 데이터 모델은 기본 항목 구조, 관계 및 항목과 관계를 모두 확장할 수 있는 기능을 포함하여 앞서 언급한 일부 혁신적 기술을 제공합니다.

    스키마

    기본 제공 스키마로 인해 보다 다양한 방식으로 데이터를 이해할 수 있으며 데이터의 메타데이터를 처리하는 더욱 구조적인 방식을 제공하기 때문에, WinFS는 기존 파일 시스템과 차별화됩니다. WinFS 스키마에는 문서, 전자 메일, 약속, 작업, 미디어, 오디오, 비디오 등의 일상적인 정보에 대한 스키마가 들어 있습니다. WinFS에는 또한 구성, 프로그램 및 기타 시스템 관련 데이터를 포함하는 시스템 스키마도 들어 있습니다.

    서비스

    동기화 및 규칙이 WinFS의 서비스 영역에 해당합니다. 이러한 기술은 WinFS의 "고급 기술"로, 시스템 기본 항목의 범위보다 폭넓은 기능을 제공합니다. 동기화를 사용하면 네트워크 전체에서 WinFS 시스템을 동기화하고 WinFS를 다른 시스템에 동기화하는 동기화 어댑터를 구축할 수 있습니다. 예를 들어, CRM 시스템의 연락처 정보를 WinFS에 동기화하여 해당 데이터를 WinFS의 다른 데이터에 연계하거나 WinFS를 통해 오프라인에서 해당 데이터로 작업할 수 있습니다. 동기화 어댑터는 양방향일 수 있습니다. 따라서 WinFS 데이터에 적용된 변경 사항이 다른 파트너 시스템에 다시 동기화될 수 있습니다.

    API

    개발자는 API를 작성합니다. WinFS에는 Longhorn의 전체 WinFX™ 프로그래밍 모델 일부인 다양한 API가 들어 있습니다. WinFS API를 통해 데이터 작업, 규칙, 동기화 및 데이터 모델을 포함하여 WinFS 시스템의 서로 다른 빌딩 블록을 프로그래밍할 수 있습니다.

    결론

    이 기사에서는 WinFS의 서로 다른 영역에 대한 심도 있는 고찰을 시작했으며 앞으로 여러 달에 걸쳐 다양한 내용을 다룰 예정입니다. WinFS에 대해 배우려면 기타 LongHorn 주요 사항, 특히 "Avalon"에 대해 철저히 이해해야 합니다. 이후 구축할 응용 프로그램의 대부분이 Avalon 기반이기 때문입니다. first Longhorn Foghorn column에서 Chris Sells가 게재한 Longhorn 주요 사항에 대한 개요를 참조하십시오. 이제 WinFS 사용을 준비할 때입니다. WinFS는 정보 기반 응용 프로그램의 미래입니다.

     

    2006년 10월 1일 일요일 오전 2:40