본문 바로가기

어린 개체 화석의 비례성장 회귀

📑 목차

    이번 글에서는 어린 개체 화석에서 비례성장 회귀를 적용하는 절차를 주제로 글을 작성할 것이다. 길이와 폭, 두개골과 장골, 치열과 턱뼈처럼 서로 다른 치수의 스케일 관계를 로그 회귀로 추정하고, 종간 비교와 왜곡 보정, 모델 선택의 한계를 설명하는 식으로 진행한다.

     

     

     

     

    어린 개체 화석의 비례성장에 대한 논점 정리

    어린 개체 화석은 형태가 완성되기 이전의 비율 변화를 보존한다. 성체 표본이 제공하는 최종 크기와 비율은 성장의 결과만을 보여주지만, 어린 표본은 성장 과정에서 어떤 부위가 먼저 커지고 어떤 부위가 늦게 따라오는지에 대한 관계 정보를 제공하는 중요한 단서이다. 비례성장 회귀는 이 관계를 수량화하는 방법 중 하나로, 두 형태 변수 사이의 스케일 법칙을 기울기로 요약하여 설명한다. 기울기가 1에 가까우면 등비 성장에 가깝고, 기울기가 1에서 벗어나면 양 또는 음의 이형성장이 나타나게 된다. 비례성장 회귀는 연령 정보가 불완전한 표본에서도 비교적 안정적인 형태 관계를 추정할 수 있다는 장점이 있다. 그러나 어린 개체 화석은 변형과 결손, 표본 편향이라는 리스크를 동반하므로, 회귀 결과를 해석하기 위해서는 변수 선택과 전처리, 회귀 방법의 가정, 비교 검정의 구조를 체계적으로 정리한 뒤 해석해야 한다. 이 글은 어린 개체 화석을 대상으로 비례성장 회귀를 수행하는 분석 흐름을 단계별로 제시하고, 결과를 종내와 종간 수준에서 해석할 때 필요한 논점을 정리하여 소개할 것이다.

     

     

     

     

    어린 개체 화석의 비례성장과 회귀식의 기본 구조

    비례성장은 한 형태 변수 y가 다른 형태 변수 x의 거듭제곱에 비례한다는 관계로 기술된다. 전통적 표현은 y = a x^b 형태이며, a는 상수, b는 비례성장 지수로 해석된다. 해당 식은 로그 변환을 통해 선형 회귀로 바뀐다. log y = log a + b log x 식에서 b가 회귀 기울기이며, 비례성장 지수의 핵심 추정치이다. 분석을 위해서는 여기서 두 가지를 구분해야 한다. 첫째, 발생 과정에서 한 개체가 성장하면서 따라가는 궤적을 추정하는 동형성장 회귀가 있다. 둘째, 같은 발달 단계에서 개체 간 변이를 비교하는 정적 비례성장 회귀가 있다. 어린 개체 화석은 연령이 명확하지 않은 경우가 많으므로, 표본이 발달 축을 따라 배열된 정도가 충분한지부터 점검해야 한다. 발달 범위가 좁으면 b의 추정이 불안정해지고, 발달 범위가 넓으면 개체 간 변이보다 발달 변화가 회귀를 지배하여 해석에 문제가 생긴다. 따라서 표본군은 치아 맹출, 골격 융합, 봉합 상태처럼 발달 표지로 단계화한 뒤, 단계 내 회귀와 단계 간 회귀를 분리하여 해석하는 설계가 오차율이 낮다.
    변수 선택은 생물학적 의미에 의해 결정되어야 한다. 예를 들어 두개골 길이에 대한 안와 폭의 비례성장은 감각기관 발달과 기능적 요구를 반영할 수 있고, 장골 길이에 대한 골단 폭의 비례성장은 체중 지지와 관련될 수 있다. 동일한 해부학적 지표라도 표본군에 따라 기능적 의미가 달라질 수 있으므로, 비교하는 목적이 기능 추정인지 계통 비교인지에 따라 x와 y의 정의를 명확히 하고 회귀식에 적용해야 한다. 또한 x와 y는 가능한 한 측정 오차가 작고 보존 손실에 덜 민감한 지표로 선택해야 한다.

     

     

     

     

    자료 전처리와 어린 개체 화석 표본의 특수한 오류 구조

    어린 개체 화석에서 가장 흔한 문제는 형태 왜곡이다. 형태 왜곡의 주 원인 중 하나인 압축 변형은 한 방향 치수를 줄이고 다른 방향 치수를 늘려 비례성장 기울기를 인위적으로 변화시킨다. 변형이 의심되는 표본은 변형 축을 추정한 뒤 2차원 또는 3차원 복원 과정을 거치거나, 최소한 변형 가능성이 낮은 치수 쌍만을 사용해야 한다. 예를 들어 같은 축 방향으로 함께 압축되는 두 길이 변수를 짝지으면 상대적 기울기 왜곡이 완화된다. 반대로 서로 직교하는 축의 치수 쌍은 변형에 매우 민감하므로 적용할 때 주의를 기울여야 한다.
    어린 개체 화석의 결손은 표본 편향을 유발한다. 작은 표본일수록 완전 보존이 어렵고, 특정 부위만 남는 경우가 많다. 단순 삭제 방식은 표본 수를 급격히 줄여 회귀의 불확실성을 키우게 된다. 대안으로는 다중 대치처럼 결손을 일정 정도 보완하는 방법이 있으나, 화석에서는 결손이 무작위가 아니어서 해당 방법은 완전한 해결 방법이 아니다. 결손의 패턴은 보존 환경과 골격의 취약성에 의해 결정되므로 결손 메커니즘을 기술하고 민감도 분석을 병행하는 방식이 필요하다.
    측정 오차는 회귀 방법 선택과 직접 연결된다. 일반 최소자승 회귀는 x가 오차가 없다는 가정을 둔다. 그러나 화석 측정에서는 x와 y 모두 오차를 가질 수밖에 없다. 특히 어린 표본은 경계가 불명확하고, 변형과 마모가 많아 오차가 비대칭적으로 증가한다. 이때 축이 바뀐 회귀를 반복하면 기울기가 달라지게 되어 문제가 발생한다. 따라서 표준화 주축 회귀, 감소 주축 회귀처럼 양 변수 오차를 고려하는 방법이 자주 권장된다. 다만 이러한 방법도 오차 분산이 일정하다는 단순 가정을 포함한 상태이므로, 반복 측정으로 오차 크기를 추정하고 오차 크기를 반영한 가중 회귀를 고려하는 접근이 바람직한 접근 방법이다.
    로그 변환은 비례성장 회귀의 핵심 절차지만, 값이 0에 가까운 치수에서는 변환이 불안정하다. 어린 개체 화석의 특정 돌기 길이처럼 매우 작은 값은 측정 단위에 따라 노이즈가 커진다. 이런 경우에는 해당 변수를 제외하거나, 발달이 충분한 지표로 대체하는 방법이 합리적이다. 로그 변환 이후 잔차의 분산이 일정한지 점검도 필수이다. 또한 잔차가 크기와 함께 증가하면 이분산이 존재하게 된다. 이분산은 기울기 추정의 신뢰구간을 왜곡하므로, 이 상황에서는 강건 회귀나 부트스트랩 기반 신뢰구간 산출이 유용하다.

     

     

     

     

    어린 개체 화석의 회귀 모델 선택과 비선형성, 절편의 해석

    비례성장 관계가 항상 하나의 직선으로 요약되는 것은 아니다. 어린 시기에는 머리나 감각기관이 상대적으로 빠르게 발달하고, 이후에는 사지나 체간이 더 크게 성장하는 등, 발달 단계에 따라 기울기가 달라진다. 이러한 변화는 단일 기울기 모델에서 잔차 패턴으로 나타나게 된다. 잔차가 특정 x 구간에서 양 또는 음으로 치우치게 된다면, 절편 문제가 아니라 기울기 변화가 원인일 가능성이 높다. 이때는 분절 회귀나 임계점 회귀로 구간별 기울기를 추정 가능하다. 임계점은 치아 교체나 골격 융합 같은 발달 사건과 일치하는지 점검해야 하며 일치가 확인되면 기능적 전환의 근거로 해석될 수 있게 된다.
    절편 log a의 해석은 신중해야 한다. 절편은 동일한 x에서 y가 얼마나 큰지를 나타내지만, x의 범위 밖으로 외삽될 때 의미가 약해진다. 또한 절편은 표본의 기준점 선택, 측정 기준, 스케일 차이에 의해 민감하게 달라지는 점을 명심해야 한다. 종간 비교에서 절편 차이를 성장 전략의 차이로 곧바로 연결하면 오류가 발생할 수 있다. 절편 비교는 가능한 한 x 범위가 겹치는 구간에서 수행되어야 하며, 겹침이 부족하면 기울기 비교에 초점을 옮겨서 오차를 줄이는 방법이 타당하다.
    공분산분석은 종 또는 집단을 범주 변수로 포함하고, log x와의 상호작용을 통해 기울기 차이를 검정하는 분석 방법이다. 상호작용이 유의하면 집단별 비례성장 지수가 다르다는 결론 또한 도출이 가능하다. 상호작용이 유의하지 않으면 공통 기울기를 가정한 뒤 절편 차이를 비교해 준다. 그러나 화석 표본에서는 표본 수가 작아 유의성 검정의 힘이 낮은 단점이 있다. 그러므로 유의성만으로 결론을 내리기보다, 효과 크기와 신뢰구간, 예측 구간을 함께 제시하는 것을 권장한다. 또한 표본 수가 작을수록 외란값 한두 개가 기울기를 크게 흔드므로, 외란값 진단과 강건 추정이 필수적이라는 사실을 명심해야 한다. 외란값은 단순 측정 오류일 수도 있고, 성차나 병리, 지역 개체군 차이를 반영할 수도 있으므로, 제거 대신 시나리오별 결과를 병기하는 방식을 추천한다.

     

     

     

     

    어린 개체 화석의 종간 비교와 발달 궤적의 정렬, 생물학적 의미 부여

    종간 비교에서 가장 어려운 문제는 발달 단계의 정렬이다. 같은 크기라도 종마다 발달 단계가 다를 수 있고, 같은 발달 표지라도 시점이 다를 수 있기 때문이다. 따라서 비례성장 회귀는 크기 축 정렬과 발달 축 정렬을 동시에 고려해서 분석해야 한다. 크기 축 정렬은 로그 변환과 스케일 표준화로 어느 정도 해결되지만, 발달 축 정렬은 치아 단계, 골격 융합, 봉합 상태 같은 질적 표지의 통합이 필수적이다. 발달 단계가 정렬되면, 종별 회귀선은 동일한 발달 구간에서 비교가 가능하다. 이때 기울기 차이는 성장 배분의 차이이다. 예를 들어 동일한 체격 증가에 대해 두개골 특정 부위가 더 빠르게 커지는 종은, 어린 시기에 해당 기능을 우선 확보해야 하는 생태적 압력을 갖는다. 반대로 사지 굵기의 증가가 상대적으로 느린 종은, 초기 이동 능력보다 다른 기능을 우선하는 발달 전략을 가질 수 있다고 가설을 세울 수 있다.
    다만 해석은 항상 대안 가설을 함께 고려해야 한다. 기울기 차이는 생활사 차이뿐 아니라 표본 구성의 차이에서도 발생한다. 한 종에서는 초기 유년기 표본이 많고 다른 종에서는 후기 유년기 표본이 많으면, 추정된 회귀 기울기는 발달 구간의 가중치 차이로 달라질 가능성이 있다. 따라서 종간 비교는 표본의 발달 분포를 가능한 한 맞추거나, 구간별 회귀를 적용하여 비교 범위를 일치시키고 진행해야 한다.
    형태 데이터가 다차원일 때는 단일 회귀만으로 충분하지 않다. 여러 치수의 조합은 서로 다른 비례성장 체계를 가지고 진행한다. 이때는 주성분 공간에서 크기 성분과 형태 성분을 분리한 뒤, 형태 성분이 크기 성분에 대해 어떻게 회귀되는지를 평가한다. 이 접근은 특정 한 치수에 의존하는 해석을 줄이고, 전반적 형태 변화를 비례성장 틀에서 설명할 수 있게 된다. 그러나 다변량 회귀는 표본 수 요구가 커지므로, 변수 수를 제한하고 교차 검증을 필수적으로 수행해야 한다.
    보고 단계에서는 회귀식, 기울기 추정치, 신뢰구간, 회귀 방법의 선택 근거가 함께 제시되어야 한다. 또한 변형 가능성 평가, 반복 측정의 오차 추정, 외란값 처리 기준, 발달 단계 기준도 함께 서술되어야 한다. 이러한 기술은 결과의 재현성과 검토 가능성을 높여서 동일 표본을 다른 목적에 활용할 때 해석 혼선을 줄인다.

     

     

     

    어린 개체의 비례성장 회귀의 중요성

    어린 개체 화석의 비례성장 회귀는 성장 과정에서의 형태 배분을 정량화하는 핵심 분석이다. 로그 선형 회귀로 표현되는 단순한 틀은 이해가 쉽지만, 화석 표본의 변형과 결손, 양 변수 측정 오차, 발달 단계의 불일치가 결합하면 결과가 쉽게 왜곡된다. 따라서 분석은 변수 선택의 생물학적 의미를 명확히 하고, 변형과 오차를 고려한 회귀 방법을 채택하며, 단일 기울기 가정이 성립하는지 잔차 진단으로 검증해야 한다. 종간 비교는 발달 단계 정렬과 표본 분포의 일치를 전제로 수행되어야 하며, 유의성 검정보다 효과 크기와 불확실성 제시가 우선되어야 한다. 이러한 원칙을 충족하면, 어린 개체 화석은 성체 중심 해석으로는 포착하기 어려운 발달 전략의 차이를 보여주는 자료로 기능할 수 있다. 비례성장 회귀는 그 차이를 구조적으로 설명하는 방법론으로서, 고생물학적 형태 해석의 정밀도를 한 단계 끌어올리는 역할을 수행하게 된다.

     

     

    [어린 개체 화석] - 작은 뼈의 성장선으로 추정하는 어린 개체 화석의 ‘성장 속도’ 읽는 방법

     

     

    어린 개체 화석의 비례성장 회귀