1. 서론화학물질의 독성 예측은 신약 개발, 환경 보호, 공중 보건 등 다양한 분야에서 필수적입니다. 그러나 독성 데이터는 일반적으로 클래스 불균형 문제를 가지고 있습니다. 예를 들어, Tox21 데이터셋에서는 독성 화합물(양성 클래스)이 비독성 화합물(음성 클래스)보다 훨씬 적습니다. 이로 인해 기계학습 모델이 양성 클래스를 제대로 학습하지 못하고, 음성 클래스에 편향되는 경향이 있습니다.기존 연구에서는 MLSMOTE(Multilabel Synthetic Minority Over-sampling Technique)와 MLSOL(Multilabel Synthetic Oversampling Based on Local Label Imbalance)을 사용하여 클래스 불균형을 해결하려 했습니다. MLSMOTE..