La mayoría de la información clínica almacenada en los sistemas sanitarios españoles se encuentra como texto no estructurado en las historias clínicas electrónicas. La extracción automática de información valiosa contenida en estos documentos es una tarea crítica. Como información valiosa para las unidades de análisis clínicos de oncología, se encuentra la localización de la neoplasia que presenta un paciente. Esta localización, incluida en la categoría de la codificación CIE-10-ES, puede ser extraída de los textos mediante el procesamiento del lenguaje natural. Para ello, en este estudio hemos desarrollado metodologías basadas en el estado del arte del procesamiento del lenguaje natural, los modelos Transformers. Los resultados obtenidos muestran que la aplicación de estos modelos es de gran ayuda en esta tarea. En particular, el modelo RoBERTa-Base-Biomed obtuvo el mejor rendimiento, con un valor de 0.946 en porcentaje de aciertos, 0.920 en precisión, 0.898 en sensibilidad y 0.908 en F1-score, mostrando un gran rendimiento para la mayoría de las clases.