제퍼넷 로고

어쨌든 누구의 줄입니까, GitHub? 개발자를 위한 몇 가지 팁

시간

의견 오픈 소스. 열려 있습니다. 당신은 볼 수 있습니다. 대부분 사용할 수 있습니다. 이름에 힌트가 있습니다. 그렇게 빠르지는 않지만 Microsoft, OpenAI 및 GitHub에 대해 제기된 집단 소송을 주장합니다. IDE 내 AI 기반의 오픈 소스 교육을 받은 제안 봇인 Copilot은 프로그래머에게 코드 라인을 제공하는 방식으로 작동하며 집단 소송에서 주장하고 규칙을 어기며 이를 숨기려고 몰래 시도하고 있습니다. 판사는 청구 중 일부가 법정에 설 자격이 있다고 판결했습니다. 친애하는 주님, 또 다른 저작권 싸움이 아닙니다.

기술은 판사에게 매우 이상하게 보일 수 있습니다. 합법적으로 전자책을 구매한다고 가정해 보겠습니다. 어떻게 얻습니까? 라우터와 캐싱 서버는 책이 배달될 때마다 책을 복사하지만 한 푼도 지불하지 않았습니다. 인터넷 인프라의 소유자는 하루에 수십억 번 저작권을 위반하고 있습니까? 멍청한 질문이라고 생각할 수도 있지만 영국 대법원은 귀찮게 여겨 유럽으로 가서 “이 인터넷은 실제로 합법적입니까?” 너무 멍청하게 굴지마, 답장이 왔다. 우리는 유럽을 그리워합니다.

Microsoft, Copilot 및 OpenAI의 코드 프롬프터에 대한 주장 중 얼마나 많은 주장이 피비린내 나는 멍청한 상자에 빠질지 아직 알 수 없습니다. 규칙이 작성되었을 때 AI가 오픈 소스 코드의 글로벌 데이터베이스를 수집하는 것을 예측한 사람은 아무도 없었습니다. 다시 말하지만, 아무도 검색 엔진이 모든 콘텐츠를 수집, 분석 및 표시하는 것을 예상하지 못했습니다. 그것은 확실히 문제가 있지만 합의는 그것이 너무 유용하고 불법화하기에 충분히 피해를 주지 않는다는 것입니다. 인터넷 콘텐츠를 제공하는 Copilot 및 기타 기계 학습 시스템은 그 점에서 검색 엔진과 거의 동일합니다. 그래서 문제는 그 결과가 받아들일 만큼 충분히 유용하지 않은가 아니면 너무 해로운가 하는 것입니다. 이익의 균형은 어디에 있습니까?

문제에 접근하는 데 유용한 방법이 있으며 여기에는 기업 경영진이 시선을 돌립니다. 윤리가 포함됩니다. 예, 정말로, 윤리적 AI에 대한 유행하는 짧은 대화는 소송보다 훨씬 더 잘 작동할 구체적인 방법을 제공합니다.

특별한 이해관계에 의해 형태가 변형된 지적재산권법의 핵심은 창작자의 정당한 의사를 존중해야 한다는 것입니다. 소프트웨어가 오픈 소스라면 제작자는 사람들이 그것을 읽고 사용할 수 있기를 합리적으로 원합니다. 이것을 부추기는 것이 세상에서 가장 나쁜 죄는 아닌 것 같습니다.

아마도 상황에 맞지 않는 코드 제안을 제시하는 방식일 것입니다. 결국 많은 오픈 소스 라이선스가 있으며 일부는 행복한 Copilot 컷 및 패스터가 알아야 할 조건을 포함할 수 있습니다. 음, Copilot이 다른 사람의 코드를 제안할 때 이를 인식할 수 있다고 가정하면 제공되는 라이선스 조건을 보고할 수 있다는 것이 무리가 아닙니다. 그것은 결과를 숨기면서 유혹을 제공하는 것보다 더 윤리적입니다. 오픈 소스 규칙을 따르는 적중률을 향상시킬 수도 있습니다.

원래 코더가 Copilot의 내장을 통해 자신의 내용이 압착되는 것을 정말로 원하지 않는다면 어떻게 될까요? 검색 엔진 세계는 robots.txt의 발명으로 이를 해결했습니다. 웹 루트 디렉토리에 해당 이름의 파일을 넣으면 웹 크롤러에 대한 "출입 금지" 표시가 나타납니다. 요즘은 상황이 좀 더 발전했기 때문에 제작자의 의도를 가장 잘 표현하는 미세 조정을 통해 GitHub의 패브릭에 그런 종류의 기능을 넣는 것이 좋을 것입니다. 어떤 경우든 콘텐츠 제공자에게 다음과 같이 말합니다. 괜찮은." 그것과 함께 사는 방법에 마음을 집중시키는 경향이 있습니다. 결과를 설명하면서 사람들에게 선택권을 주나요? 멋진.

사람들에게 Copilot 등에서 코드를 제거할 수 있는 권한을 부여하여 많은 좋은 것들이 사라지더라도 그것이 세상의 끝은 아닙니다. 1980년대 IBM의 지배적 위치를 무너뜨리고 미친 듯이 시장을 가속시킨 "클린룸 원칙"이 있습니다. 이것은 기계 학습이 많은 것을 배울 수 있는 것입니다.

최초의 IBM PC는 거의 전적으로 오픈 소스였습니다. IBM은 칩 제조업체가 무료로 제공한 표준 방식으로 함께 연결된 표준 칩을 사용하여 전체 회로도가 포함된 기술 매뉴얼을 출판했습니다. 기능적으로 동등하지만 저작권이 없는 IBM PC 클론을 설계하는 것은 수천 명의 전자 엔지니어가 할 수 있는 일이었고 수백 명이 했습니다.

베이지색 상자의 법적 지뢰는 BIOS, 기본 입출력 시스템, 인터럽트를 통해 운영 체제 및 응용 프로그램에 표준 하드웨어 서비스 세트를 제공하는 비교적 작은 영구 소프트웨어 덩어리(오늘날 API라고 함)였습니다. 복제본에 대해 해당 코드를 방금 복사했다면 IBM은 권리를 행사하게 될 것입니다. 당신은 코드를 재작성할 수 있지만, IBM은 당신이 그 어떤 것도 복사하지 않았다는 것을 증명하기 위해 당신을 소송에 묶을 수 있습니다. 당신이 이기더라도 지연과 비용은 당신을 침몰시킬 것입니다.

클린룸에 신호를 보냅니다. 복제업자들은 IBM의 BIOS를 한 줄도 읽지 않는 코더를 고용하고 그렇게 하는 것을 금지했습니다. 이 프로그래머들은 저작권이 없는 API를 받았고 해당 사양에 따라 작성하라는 지시를 받았습니다. 법적 증명을 통해 클로너들은 법정에서 기꺼이 맹세했고, 본 적이 없는 것은 복사할 수 없다는 원칙을 유지했습니다. 그리고 원래 클론 전쟁의 퍼즐의 마지막 조각이 제자리에 있었습니다. API가 저작권에 대한 강력한 해독제를 제공한다는 사실로 인해 많은 사람들이 자신의 법적 지위를 변경하려고 시도했습니다. 가장 최근에는 구글 대 오라클. 그것은 다른 모든 것과 마찬가지로 실패한 미국 대법원에서 끝났습니다.

따라서 코드 내에서 인터페이스를 찾고 격리하는 전용 시스템과 이러한 인터페이스를 제공하는 코드를 생성하는 규칙을 적용하는 전용 시스템인 두 개의 자동화 시스템을 사용하십시오. 가상 에어 갭을 통해 코드 라인이 전송되지 않습니다. 원본 코드와 AI 코드를 자동으로 테스트하면 품질이 향상됩니다. 모두에게 이익이 되도록 리팩토링을 위한 매우 훌륭한 도구 세트가 탄생할 것입니다. 윤리적으로 들리죠?

거기에 있습니다. Copilot이 수행하는 작업에 진정한 문제가 있는 경우 유용성을 유지하고 새로운 이점을 창출하면서 문제를 방지할 수 있는 여러 가지 방법이 있습니다. 규칙을 지키면서 상황을 개선하시겠습니까? 그것은 좋은 라인입니다. ®

spot_img

최신 인텔리전스

spot_img