한국어 텍스트를 한국 점자로 변환하는 라이브러리.
libs/braillify/— Rust 핵심 변환 엔진packages/node/— Node.js WASM 바인딩packages/python/— Python 바인딩 (maturin)apps/landing/— Next.js 랜딩 페이지test_cases/— 점자 변환 테스트 케이스 (JSON)docs/— 2024 개정 한국 점자 규정 PDFbraillove-case-collector/— 점자 내부표기 → 숫자/유니코드 변환기
bun install
cargo build --release -p braillify
bun test # 전체 테스트 (Rust + Bun + Python)
bun test test_cases/ # 테스트케이스 무결성 검증만test_cases/korean/rule_{N}.json— 한글 점자 제N항test_cases/korean/rule_{N}_b1.json— 제N항 붙임 1test_cases/math/math_{N}.json— 수학 점자 제N항- 근거:
docs/2024 개정 한국 점자 규정.pdf
{
"input": "입력 텍스트 (묵자 또는 LaTeX)",
"note": "설명 (선택, 동일 input이 여럿이거나 맥락 필요 시에만)",
"internal": "점자 내부표기",
"expected": "브라유셀 인덱스 연결 문자열",
"unicode": "점자 유니코드 문자열",
"world": "경쟁사(World) 점역 결과 (참고용, 수정 금지)",
"jeomsarang": "경쟁사(점사랑) 점역 결과 (참고용, 수정 금지)"
}world,jeomsarang은 타 업체 점역 프로그램의 결과를 그대로 보존한 참고용 필드다.- braillify의 정답이 아니다. braillify의 정답은 오직
unicode(=expected)이며, PDF 규정에 근거한다. - 절대로 수정하지 않는다. input/internal을 정정하더라도
world/jeomsarang은 원본 그대로 둔다. - testcase 검수의 기준으로 사용하지 않는다.
world/jeomsarang이 우리unicode와 다르더라도 testcase 오류 근거가 아니며, 그것들이 틀린 것은 braillify와 무관하다. - 인코더 정답 비교 대상이 아니다.
cargo test test_by_testcase는 인코더 결과를expected/unicode와만 비교한다. - 이 필드의 존재 의도는 외부 점역 결과와의 차이를 관찰하기 위한 읽기 전용 비교 자료이지, 별도 지표가 되어서는 안 된다.
braillove-case-collector/converter.py의 패턴을 따른다:
pattern: " a1b'k2l@cif/msp"e3h9o6r^djg>ntq,*5<-u8v.%[$+x!&;:4\0z7(_?w]#y)="
braille: ⠀⠁⠂⠃⠄⠅⠆⠇⠈⠉⠊⠋⠌⠍⠎⠏⠐⠑⠒⠓⠔⠕⠖⠗⠘⠙⠚⠛⠜⠝⠞⠟⠠⠡⠢⠣⠤⠥⠦⠧⠨⠩⠪⠫⠬⠭⠮⠯⠰⠱⠲⠳⠴⠵⠶⠷⠸⠹⠺⠻⠼⠽⠾⠿
특수 매핑: `→0, {→42, }→59, ~→24, |→51
expected는 각 문자의 인덱스를 문자열로 이어붙인 것, unicode는 대응하는 점자 유니코드 문자를 이어붙인 것이다.
test_cases/testcase-integrity.test.ts가 모든 엔트리의 internal → expected/unicode 일치를 검증한다. 대문자(수학 변수 A, B 등)를 포함한 internal은 기본 패턴 외이므로 skip된다.
- PDF가 유일한 근거 —
docs/2024 개정 한국 점자 규정.pdf에 없는 예제를 만들지 않는다. - PDF 순서 준수 — 기호 정의 → 해당 예제 순서로, PDF에 나온 순서 그대로 배치한다.
- 기호 단독 엔트리 필수 — 각 기호는 단독 엔트리로 먼저 등록하고, 그 뒤에 해당 기호를 사용하는 예제가 온다.
- note는 필요할 때만 — 동일 input이 다른 의미로 쓰일 때, 또는 맥락이 필요할 때만 추가한다. input을 반복하는 note는 쓰지 않는다.
- 소속 정확히 — 각 엔트리는 해당 항 파일에만 존재한다. 다른 항의 예제를 섞지 않는다.
수학 수식은 LaTeX 형식의 input도 테스트한다. 기존 엔트리의 LaTeX 버전을 추가하는 방식이다:
- 형식:
$<LaTeX 수식>$(앞에$, 뒤에$) - 동일한
internal/expected/unicode를 공유 "note": "LaTeX"표기- 기존 예제의 변환만 — 새로운 수식을 만들지 않는다
{
"input": "$\\frac{3}{4}$",
"note": "LaTeX",
"internal": "#d/#c",
"expected": "6025129",
"unicode": "⠼⠙⠌⠉"
}수식의 분수는 반드시 LaTeX \frac{numerator}{denominator} 형식만 사용한다. /(슬래시)는 분수 표기와 별개의 표현이며 두 가지를 혼용하지 않는다.
- ✅
$\frac{e^x-e^{-x}}{2}$— 분수 - ❌
(e^x-e^{-x})/2— 슬래시(분수 아님) - ❌
$(e^x-e^{-x})/2$— LaTeX 안의 슬래시도 분수 아님
/는 단순 슬래시 기호 점역으로 처리되며, 분수의 의미를 가지려면 \frac{}{}로 명시해야 한다. testcase 작성 시 분수 의미가 있는 모든 표현을 LaTeX로 통일한다. (수학 분수는 한국 점자 점역 시 분모를 분자보다 먼저 점역하므로 \frac{a}{b} → b/a 점역 결과가 나온다.)
주요 LaTeX 변환:
| 수식 | LaTeX |
|---|---|
| 분수 | $\frac{분자}{분모}$ |
| 근호 | $\sqrt{x}$, $\sqrt[n]{x}$ |
| 위첨자 | $x^{2}$ |
| 아래첨자 | $x_{n}$ |
| 부등호 | $\neq$, $\geq$, $\leq$ |
| 절댓값 | $|x|$ |
| 무한대 | $\infty$ |
| 적분 | $\int f(x)dx$ |
| 집합 | $\cup$, $\cap$, $\subset$, $\emptyset$ |
| 논리 | $\land$, $\lor$, $\forall$, $\exists$ |
수학 점자에서 대문자 변수(A, B, N 등)를 사용하는 internal은 기본 64셀 패턴에 포함되지 않는다. 이런 엔트리는 expected/unicode가 빈 문자열이며, 무결성 테스트에서 자동으로 skip된다.
세부 규칙은
libs/braillify/AGENTS.md#test-organization-non-negotiable참조. 아래는 모든 Rust 코드에 공통 적용되는 원칙이다.
테스트 코드는 다음 우선순위로 배치한다:
- inline
#[cfg(test)] mod tests { ... }— 검증 대상.rs파일 하단에 직접 작성 (기본값) - owning module 안의 inline
#[cfg(test)] mod <name> { ... }— 여러 모듈이 공유하는 테스트 utility 는 가장 가까운 공통 부모 모듈 (보통lib.rs) 에 inline 블록으로 둔다 tests/폴더 (integration test) — 위 두 가지 모두 불가능한 경우 (예: 공개 API 만 사용하는 시나리오 테스트)
금지:
- ❌
src/트리 내 test 전용 standalone.rs파일 (src/test_helpers.rs,src/foo_test.rs등) - ❌ production code 와 같은 파일에
#[cfg(test)]가드 없이 두는 테스트 fixture
같은 호출 shape (동일 함수 호출, 입력/기대값만 다름) 으로 3개 이상의 케이스가 모이면 반드시 rstest::rstest 로 변환한다.
// ✅ 권장
#[rstest::rstest]
#[case::one('1', '⠁')]
#[case::zero('0', '⠚')]
#[case::nine('9', '⠊')]
fn encodes_digits(#[case] ch: char, #[case] expected: char) {
assert_eq!(encode_digit(ch).unwrap(), decode_unicode(expected));
}
// ❌ for-loop 테이블 패턴은 새로 추가하지 않는다
#[test]
fn encodes_digits_BAD() {
for (ch, expected) in [('1', '⠁'), ('0', '⠚'), ('9', '⠊')] {
assert_eq!(encode_digit(ch).unwrap(), decode_unicode(expected));
}
}원칙:
#[case::label(...)]의 label 은 의미를 담는다 (#[case::lower_a],#[case::overflow_max]등) — 실패 메시지에서 즉시 케이스 식별 가능- 단일 입력만 다른 경우
#[values(...)]사용 가능 (fn t(#[values('a', 'b')] c: char)) - assertion 없는 smoke test 는 변환 의무 없음 — for-loop 가 더 간결하면 유지
- 기존 테스트를 수정할 때 3+ assertion 패턴을 발견하면 그 자리에서 rstest 로 마이그레이션 한다
변환 로직은 PDF 규정에 근거한 일반 알고리즘으로 작성한다. 테스트 통과가 목적이 아니라, 모든 변형 입력을 규정대로 변환하는 것이 목적이다.
- 테스트 케이스는 가능한 입력의 작은 부분집합일 뿐이다
- 알고리즘이 옳다면 테스트는 자연히 통과한다
- "테스트와 결과가 다르니 코드를 맞춘다"가 아니라, 테스트와 결과가 다르면 알고리즘 또는 테스트 둘 중 하나가 틀린 것이다
- 테스트에 없는 새로운 입력이 들어와도 동일한 알고리즘으로 정확히 처리되어야 한다
// 금지
if input == "안녕하세요" { return "⠁⠉⠊..."; }
match input {
"안녕" => "...",
"학교" => "...",
_ => fallback(),
}// 금지 — 테스트 입력/출력을 그대로 박아넣은 것
const KNOWN: &[(&str, &str)] = &[
("안녕", "⠁⠉..."),
("학교", "⠚⠁..."),
];테스트 JSON의 expected/unicode 값을 보고 그 값이 나오도록 코드를 작성하는 것. 알고리즘은 오직 docs/2024 개정 한국 점자 규정.pdf의 규정에서만 도출한다.
변환 로직이 test_cases/ 경로의 파일을 읽거나 import하거나 참조하는 코드 일체. 테스트 데이터는 검증 단계에서만 쓰인다.
같은 종류의 처리를 입력 단위마다 if/else 또는 match로 늘어놓는 것. 같은 규정이 적용되는 입력은 하나의 일반 함수로 처리한다.
// 금지 — 음절별로 결과를 박아넣는 패턴
fn convert_syllable(s: &str) -> &str {
match s {
"각" => "⠊⠁⠁",
"간" => "⠊⠁⠉",
"갈" => "⠊⠁⠂",
// ... 수천 줄
}
}
// 올바름 — 초성/중성/종성 분해 후 규정대로 조합
fn convert_syllable(s: char) -> Vec<BrailleCell> {
let (cho, jung, jong) = decompose_hangul(s);
let mut out = vec![];
out.extend(cho_to_braille(cho));
out.extend(jung_to_braille(jung));
if let Some(j) = jong { out.extend(jong_to_braille(j)); }
out
}예외: 단일 자모/기호의 점형 정의(예: ㄱ → ⠈, 숫자 표시 → ⠼)는 PDF가 명시한 기본 매핑이므로 허용된다. 음절/단어/구절 단위의 매핑은 모두 금지.
- PDF 규정 → 알고리즘 — 각 항(제N항)을 함수로 분리하고, 함수 doc에 근거 항 번호를 명시한다
- 계층 분해 — 자모 → 음절 → 단어 → 문장 순으로 단계화하여 각 층은 자기 책임만 진다
- 테스트는 검증 도구 — 알고리즘이 PDF 규정과 일치하는지 확인하는 용도이지, 코드가 맞춰야 할 정답표가 아니다
- 테스트 추가 시 코드 수정 불필요 — 같은 규정에 속하는 새 예제는 이미 알고리즘이 처리하고 있어야 한다. 새 예제 추가만으로 코드 변경이 필요하다면 알고리즘이 일반화되지 않은 것이다
PR/커밋 전 다음을 모두 확인한다:
- 변환 로직 안에
test_cases/경로 문자열이 없다 - 테스트의
input문자열이 코드에 리터럴로 등장하지 않는다 (단일 자모/기호 제외) - 테스트의
expected/unicode문자열이 코드에 리터럴로 등장하지 않는다 - 같은 규정의 새 예제를 추가해도 코드 수정 없이 통과한다
- 음절/단어 단위 분기가 자모 단위 일반 함수로 통합되어 있다
- 모든 분기와 매핑은 PDF의 특정 항을 근거로 추적 가능하다