- [ ] 수집 중인 데이터의 사용 사례는 무엇인가?
- [ ] 같은 데이터셋의 여러 버전을 생성하는 대신 이 데이터를 재사용할 수 있는가?
- [ ] 시스템이 이 데이터를 안정적으로 생성하고 수집하고 있는가?
- [ ] 필요할 때 해당 데이터를 사용할 수 있는가?
- [ ] 수집 후 데이터 목적지는 어디인가?
- [ ] 데이터에 얼마나 자주 접근해야 하는가?
- [ ] 데이터는 보통 어느 정도의 용량으로 도착하는가?
- [ ] 데이터 형식은 무엇일까?
- [ ] 다운 스트림 스토리지 및 변환 시스템에서 이 형식을 처리할 수 있을까?
- [ ] 원천 데이터는 다운 스트림에서 즉시 사용할 수 있는 양호한 상태일까?
- [ ] 그렇다면 얼마나 오래 사용할 수 있고, 사용할 수 없게 되는 요인은 무엇일까?
- [ ] 데이터가 스트리밍 소스에서 전송되는 경우, 목적지에 도달하기 전에 데이터를 변환해야 할까?
- [ ] 데이터가 스트림 자체 내에서 변환되는 형태의 변환이 적절할까?