제퍼넷 로고

PDF를 시각적으로 비교

시간

때로는 문제가 어려워 보이지만 올바른 통찰력은 문제를 쉽게 만들 수 있습니다. 두 개의 PDF 파일을 비교하고 차이점을 보여주는 프로그램을 작성하라는 요청을 받았다면 얼마나 어려울 것 같습니까? 당신이 [serhack]이라면, 당신은 해낼 것입니다 훨씬 쉽게 당신이 추측하는 것보다.

물론 때로는 단순하게 만드는 것이 가정을 단순화하는 것에 달려 있습니다. 삽입 및 삭제를 표시하는 "diff와 같은" 유틸리티를 기대하고 있다면 여기에서 진행 중인 작업이 아닙니다. 대신 빨간색 상자로 강조 표시된 변경 사항이 있는 PDF 이미지가 표시됩니다. 프로그램이 사용 가능한 유틸리티를 사용하여 PDF를 이미지로 렌더링한 다음 결과 이미지의 픽셀을 단순히 비교하여 일치하지 않는 부분에 빨간색 상자를 그리기 때문에 쉽습니다.

분명히 이것은 약간의 변경 사항이 있는 PDF에 가장 적합합니다. 예를 들어 단락을 삽입하면 출력이 매우 쓸모 없게 됩니다. 이를 위해 pdf2text(이미지 생성에 사용하는 것과 동일한 기본 라이브러리 사용)와 같은 것을 사용하여 PDF에서 텍스트를 추출하는 것을 고려할 수 있습니다.

프로그램은 누락된 파일에 대한 많은 메시지를 표시하지만 어쨌든 작업을 수행하는 것 같습니다. 다음은 몇 분 간격으로 PDF로 캡처된 두 가지 버전의 Hackaday 홈페이지를 비교한 결과입니다.

그러나 새 기사가 게시되고 모든 것이 하나씩 아래로 미끄러지면 거대한 빨간 블록만 남게 된다는 것을 알 수 있습니다.

그것은 여전히 ​​​​영리한 아이디어입니다. 이를 위한 도구는 놀랍게도 거의 없습니다. 다른 몇 가지를 찾아. 물론 많이 있습니다. PDF 조작을 위한 Linux 도구. 그들 중 많은 사람들이 다른 도구의 매쉬업 이것처럼.

spot_img

최신 인텔리전스

spot_img