아래의 처리는 html 태그 제거가 좋았음
<pre>, <xmp> 등 위험한 태그가 확실히 제거되었음.
< pre >, < pre>, < xmp >, < xmp> 처럼 올바른 태그가 아닌 경우 입력한 그대로 나타나서 좋았음.
<한글>, < 한글>, < 한글 >의 경우 올바른 태그가 아니므로 입력한 그대로 나타나서 좋았음.
<%
String str = "<html>";
str += "<head>";
str += "<title> New Document </title>";
str += "<meta name=\"Generator\" content=\"EditPlus\">";
str += "<meta name=\"Author\" content=\"\">";
str += "<meta name=\"Keywords\" content=\"\">";
str += "<meta name=\"Description\" content=\"\">";
str += "</head>";
str += "<body>";
str += "<script language=\"JavaScript\">";
str += "<!--";
str += "alert(\"자바스크립트에 주석이 있을 때\")";
str += "//-->";
str += "</script>";
str += "<script language=\"JavaScript\">";
str += "alert(\"자바스크립트에 주석이 없을 때\")";
str += "</script>";
str += "태그가 제거되나";
str += "글이 < 크거나 작거나 <크면 작으면>";
str += "</body>";
str += "</html>";
String content = str.replaceAll("<(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>", "");
중요 : \\s 는 문자열 상태에 따라서 \s로 표기해야할 때도 있다
<(/)?([a-zA-Z]*)(\s[a-zA-Z]*=[^>]*)?(\s)*(/)?>
%>
<%=content%>