제퍼넷 로고

화학 온톨로지 탐구

시간

저자에 대해 자세히 알아 보려면 클릭하십시오. 마르티나 폴 레타.

우리는 종종 온톨로지로 작업 할 수 있는지 묻습니다. "온톨로지로 작업"하면 사람들은 여러 가지를 의미 할 수 있지만 오늘은 특정 존재론 마지막에 대화 형 도구를 만들기 위해 온톨로지를 읽고 쿼리하는 것을 포함한 기본 작업. 이를 위해 오늘 우리는 ChEBI 온톨로지 (Chemical Entities of Biological Interest)를 사용하기 위해 화학의 세계로 뛰어 들었습니다. 

화학이 관심 영역이 아니더라도이 블로그 게시물은 예를 들어 OWL 파일을 읽고 SPARQL에서 쿼리를 생성하는 방법을 보여줄뿐만 아니라 대화식 복합보기. 이를 자신의 사용 사례, 온톨로지 및 추출 된 데이터 세트에 채택하는 방법은 귀하와 귀하의 상상력에 맡길 것입니다. 

체비

특히 생명 과학 분야에서 온톨로지는 매우 인기가 있으며 다음과 같은 다양한 목적으로 자주 사용됩니다. 데이터 통합, 큐 레이션, 표준 정의 또는 라벨링. 온톨로지가 얼마나 중요한지는 바이오포털 [1]은 이미 저장소에 800 개가 넘는 온톨로지를 포함하고 있습니다.

이 블로그 게시물에 설명 된 워크 플로를 사용하여 체비 [2]는 화학 화합물의 분류뿐만 아니라 그 응용이나 생물학적 및 화학적 역할과 같은 화합물의 역할에 대한 정보를 포함하는 무료로 사용 가능한 온톨로지입니다. 일반적으로 화학 물질, 역할 및 아 원자 입자와 같은 세 가지 주요 분류를 포함합니다. 이 워크 플로에서 우리는 분자 실체 과 역할 클래스 (그림 1 참조). 

ChEBI는 다양한 파일 형식으로 다운로드 할 수 있습니다. 오늘은 다운로드 할 수있는 OWL 파일로 작업 할 것입니다. 여기에서 지금 확인해 보세요..

그림 1 : ChEBI 클래스 개요 (스크린 샷 여기에서 지금 확인해 보세요.). 노란색 상자는 워크 플로에서 어떤 부분이 사용되고 탐색되는지 보여줍니다. 나머지 부분은 무시됩니다..

시작하자!

OWL 형식으로 저장된 온톨로지를 기본적으로 읽고 쿼리하는 방법은 블로그 게시물에 설명되어 있습니다. 그들은 혼합 될까요? 시맨틱 웹 만나기. 이 기사에 설명 된 예제에서 우리는 피자 온톨로지를 사용하여 데이터 유형을 탐색하는 것이 얼마나 쉬운 지 보여주었습니다.

다음 예제 워크 플로를 사용하여 콘텐츠를 탐색 할 수있는 대화 형보기를 만들기 위해 검색, 결과 및 데이터를 결합하는 동안 ChEBI 온톨로지의 용어 및 콘텐츠를 사용합니다. 화합물, 생물학적 및 화학적 역할, 특정 화합물에 대한 참조를 포함하는 정의 및 기타 소스에 대해 배우기를 바랍니다.

이 분석은 그림 2에 표시된 워크 플로에서 실현되었으며 다음과 같은 주요 단계를 포함합니다.

  • 1 단계 OWL 파일을 SPARQL 엔드 포인트로 읽기
  • 2 단계 화합물의 하부 구조 검색 및 역할 선정
  • 3 단계 하위 구조 검색 및 역할과 일치하는 화합물을 봅니다. 여기서 하나의 화합물을 선택해야합니다.
  • 4 단계 모든 상위 클래스, 계층 및 역할과 함께 네트워크에서 선택한 화합물을 표시합니다. 다음 단계에서 더 많은 데이터를 병합하려면 태그 클라우드에서 질병을 선택하십시오.
  • 5 단계 4 단계에서 선택한 결과보기
그림 2 : OWL 형식으로 저장된 ChEBI 온톨로지를 탐색하는 방법을 보여주는 워크 플로의 예.

1 단계. SPARQL 엔드 포인트로 OWL 파일 읽기

앞서 설명한 피자 온톨로지 사용 사례와 유사하게 트리플 파일 리더 노드는 OWL 파일을 읽고 트리플 목록을 SPARQL 엔드 포인트에 삽입합니다. 메모리 끝점 노드 (그림 2, 1 단계 참조). 이를 제자리에두고 성공적으로 실행 했으므로 이제 SPARQL 쿼리를 작성하고 실행하고 Triples 목록에서 정보를 필터링 할 수있는 기반이 생겼습니다.

여기서 빠른 알림 : RDF 트리플 (시맨틱 트리플이라고도 함)에는 항상 제목, 술어 및 객체의 세 열이 포함됩니다. 더 읽어보기 여기에서 지금 확인해 보세요.

그림 3 : RDF 트리플을 해석하는 방법을 보여주는 스키마.

2 단계. 역할 정보와 쌍을 이루는 하위 구조 검색

과학자가 개발중인 새로운 화합물을 조사하고 있다고 상상해보십시오. 그녀는 화학 구조와 그 화합물의 적용을 알고 있지만 비슷한 특성을 가진 다른 화합물이 ChEBI에 있는지 궁금합니다. 이 예제 워크 플로에서 미소 하위 구조 검색을 추가하고 화합물의 응용 또는 생물학적 / 화학적 역할을 선택할 수 있습니다 (그림 4 참조).

따라서 "검색 옵션 입력"구성 요소는 위에서 언급 한 속성을 추가하기위한 검색 쿼리를 만드는 데 사용됩니다 (구성 요소를 마우스 오른쪽 단추로 클릭 → 대화 형보기 선택). 

SMILES 삽입을 허용하기 위해 String Widget 노드를 사용했습니다. 여기 그림 4에서 우리는 페 노티 아진

선택합시다 도파민 성 길항제 역할로. 이것은 정신 분열증, 양극성 장애 또는 정신병 자극제를 치료하기위한 항 정신병 약물에 자주 사용됩니다.

그림 4 : "검색 옵션 입력"구성 요소에는 화합물 검색뿐 아니라 하위 구조 검색에 대한 입력을 입력하는 두 가지 옵션이 있습니다. 온톨로지에서 특정 역할이 할당됩니다.

여기에 약간의 힌트 : 문자열 위젯은 분자 문자열 입력 노드도 사용할 수 있습니다. 이렇게하면 SMILES 문자열을 붙여 넣는 대신 화학 구조를 그릴 수 있습니다. 

3 단계. 첫 번째 결과를 보겠습니다!

다음보기 (예제 워크 플로의 "결과보기"구성 요소)에서 하위 구조 검색 결과를 검사 할 수 있습니다. 여기 타일보기 과 RDKit 강조 입력 한 검색 옵션과 일치하는 모든 화합물을 표시하는 데 사용되었습니다. 이러한 모든 화합물은 이전보기에서 선택한 도파민 성 길항제입니다.

이 예에서 우리는 프로 마진 자세한 정보를 보려면.

그림 5 : Tile View 노드를 사용하여 하위 구조가 강조 표시된 화합물을 보여주는 결과보기.

4 단계. 수업 정보가있는 네트워크 표시

이 예제 워크 플로에서는 온톨로지를 네트워크로 시각화하는 방법도 보여 드리고자합니다. 우리는 네트워크 마이닝 확장. 이 단계의보기도 대화 형입니다. 즉, 네트워크의 노드가 선택 될 때마다 네트워크 아래의 테이블에 정의와 같은 추출 된 엔터티에 대한 추가 정보가 표시됩니다.

그림 6 : 선택한 화합물과 하위 ClassOf 연결을 "has role"및 "is a"로 포함하는 네트워크를 보여주는 네트워크보기. 또한 정의 및 동의어와 같은 추가 정보를 선택하여 네트워크의 노드에 표시 할 수 있습니다.

아래로 스크롤하면 두 번째 네트워크가 표시됩니다. 이 네트워크는 선택된 화합물 (여기서는 Promazine)에서 시작하는 엔티티를 포함하며 ChEBI에서 어떻게 분류되었는지 보여줍니다. 모든 "하는"는 화합물에서 화학 물질. 또한 “역할이있다”링크가 추가되어 여기에 링크 된 역할 (파란색 노드)도 표시됩니다. 

그림 7 : 선택한 화합물과 하위 ClassOf 연결이 "역할 있음"및 "is a"로 포함 된 네트워크를 보여주는 네트워크보기. 

5 단계. 두 가지 역할을 공유하는 화합물 표시

그림 6의 네트워크보기를보고 화합물의 역할을 조사함으로써 – 이제 다른 흥미로운 역할을 볼 수 있고 해당 역할을 가진 더 많은 화합물을보고 싶다고 가정 해 보겠습니다. 한 단계 더 나아가 두 가지 역할을 선택할 수 있습니다. 예를 들어 이미 알려진 테이블에서 도파민 성 길항제 와 함께 H1- 수용체 길항제 그것은 알레르기 반응을 완화시키는 역할을합니다. 

마지막 구성 요소 인 "선택한 역할을 공유하는 화합물보기"(5 단계)에서는 선택한 역할과 다른 온톨로지, 데이터베이스 및 소스에 대한 참조와 같은 추가 정보를 모두 포함하는 모든 화합물을 볼 수 있습니다.

그림 8 : 네트워크보기에서 선택한 "역할"이있는 추가 정보가 포함 된 화합물을 보여주는 워크 플로우의 마지막 대화식보기.

워크 플로를 실행하는 데 필요한 확장 : 

확장 설치 방법에 대한 지침을 찾을 수 있습니다. 여기에서 지금 확인해 보세요..

최대 포장

우리는 ChEBI 온톨로지를 포함하는 OWL 파일로 시작하여 다양한 데이터 탐색 및 시각화 단계를 거쳤습니다. 우리는 OWL 파일을 읽는 방법, SPARQL에서 쿼리를 만드는 방법을 보여 주며 대화 형 복합보기에서 온톨로지 콘텐츠를 시각화하는 다양한 가능성을 제시했습니다. 이를 통해 우리는 Promazine 화합물과 그 화합물의 생물학적 및 화학적 역할에 대해 배웠습니다. 또한 유사한 화합물과 그 역할, 정의 및 동의어에 대해 더 많이 발견했습니다.

ChEBI 온톨로지에서 추출 된 결과 데이터는 분석 플랫폼을 사용하여 직접 탐색 할 수 있습니다. 워크 플로는 다음 위치에도 배포 할 수 있습니다. 서버 온톨로지 전문가가 아닌 특정 연구 분야의 전문가가 데이터를 분석 할 수있는 웹 포털 SPARQL 쿼리를 작성할 필요가 없습니다.

이 블로그 게시물 인 ChEBI Ontology Explorer에 설명 된 워크 플로를 다운로드 할 수 있습니다. 여기에서 지금 확인해 보세요. 허브에서.

참고자료

[1] Whetzel PL, Noy NF, Shah NH, Alexander PR, Nyulas C, Tudorache T, Musen MA. BioPortal : National Center for Biomedical Ontology의 새로운 웹 서비스를 통해 소프트웨어 애플리케이션에서 온톨로지를 액세스하고 사용하는 기능이 향상되었습니다. Nucleic Acids Res. 2011 년 39 월; 541 (웹 서버 호) : W5-2011. Epub 14 XNUMX 월 XNUMX.

[2] Hastings J, Owen G, Dekker A, Ennis M, Kale N, Muthukrishnan V, Turner S, Swainston N, Mendes P, Steinbeck C. (2016). 2016 년 ChEBI : 서비스 개선 및 대사 산물 수집 확대. Nucleic Acids Res.

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처 : https://www.dataversity.net/exploring-a-chemistry-ontology/

spot_img

최신 인텔리전스

spot_img