WO2025089153A1 - Substrate processing method and substrate processing system - Google Patents
Substrate processing method and substrate processing system Download PDFInfo
- Publication number
- WO2025089153A1 WO2025089153A1 PCT/JP2024/036813 JP2024036813W WO2025089153A1 WO 2025089153 A1 WO2025089153 A1 WO 2025089153A1 JP 2024036813 W JP2024036813 W JP 2024036813W WO 2025089153 A1 WO2025089153 A1 WO 2025089153A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- etching amount
- etching
- amount distribution
- distributions
- effective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L21/00—Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
- H01L21/02—Manufacture or treatment of semiconductor devices or of parts thereof
- H01L21/04—Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer
- H01L21/18—Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer the devices having semiconductor bodies comprising elements of Group IV of the Periodic Table or AIIIBV compounds with or without impurities, e.g. doping materials
- H01L21/30—Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26
- H01L21/302—Treatment of semiconductor bodies using processes or apparatus not provided for in groups H01L21/20 - H01L21/26 to change their surface-physical characteristics or shape, e.g. etching, polishing, cutting
- H01L21/306—Chemical or electrical treatment, e.g. electrolytic etching
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L22/00—Testing or measuring during manufacture or treatment; Reliability measurements, i.e. testing of parts without further processing to modify the parts as such; Structural arrangements therefor
Definitions
- This disclosure relates to a substrate processing method and a substrate processing system.
- Patent Document 1 discloses a method for determining optimal etching conditions when etching the surface of a substrate.
- the radial etching amount distribution is obtained when the surface of a substrate is etched under a plurality of different etching conditions.
- an optimization technique is used to optimize the combination of the etching amount distributions used for superimposition and the number of times the etching amount distributions are superimposed, so that the shape of the substrate surface becomes the target shape by superimposing the etching amount distributions.
- the etching conditions corresponding to the optimized combination are integrated to determine the optimal etching conditions.
- the technology disclosed herein efficiently optimizes the etching conditions when etching the surface of a substrate.
- One aspect of the present disclosure is a substrate processing method for processing a substrate, comprising: optimizing an etching amount distribution to determine optimal etching conditions; and supplying an etching solution to a surface of the substrate based on the optimal etching conditions to etch the surface.
- Determining the optimal etching conditions includes obtaining multiple radial etching amount distributions when the surface of the substrate is etched under multiple different etching conditions; screening the multiple etching amount distributions to remove at least one of an etching amount distribution unnecessary for the optimization process and a similar etching amount distribution to select multiple effective etching amount distributions; superimposing the multiple effective etching amount distributions using an optimization method to optimize a combination of the effective etching amount distribution used for superimposition and the number of times the effective etching amount distributions are superimposed so that the shape of the surface of the substrate becomes a target shape; and determining the optimal etching conditions by integrating the etching conditions corresponding to the optimized combination.
- etching conditions can be efficiently optimized when etching the surface of a substrate.
- FIG. 1 is a plan view showing an outline of a configuration of a wafer processing system;
- FIG. 1 is a side view showing an outline of the configuration of an etching apparatus.
- FIG. 11 is an explanatory diagram showing a state in which a nozzle moves in a radial direction.
- FIG. 1 is a flow diagram showing main steps of wafer processing.
- FIG. 2 is a flow chart showing main steps of a method for determining optimal etching conditions.
- FIG. 13 is an explanatory diagram showing an example of a learning data acquisition screen displayed on a display panel.
- FIG. 13 is an explanatory diagram showing an example of a learning data selection screen displayed on a display panel.
- FIG. 1 is a flow diagram showing the main steps of a method for screening training data using a first pattern of geometric techniques.
- FIG. 11 is an explanatory diagram showing how a plurality of training data are screened using a first pattern geometric method.
- FIG. 11 is a flow diagram showing the main steps of a training data screening method using a second pattern of graphical techniques.
- FIG. 13 is an explanatory diagram showing the screening of multiple training data using a second pattern of graphical techniques.
- FIG. 13 is an explanatory diagram showing the screening of multiple training data using a second pattern of graphical techniques.
- FIG. 11 is a flow diagram showing main steps of a training data screening method using the third pattern of the QR decomposition technique.
- the cut surface of a disk-shaped silicon wafer (hereafter referred to as "wafer") obtained by cutting a single crystal silicon ingot with a wire saw or the like is flattened and further smoothed to make the thickness of the wafer uniform.
- the cut surface is flattened, for example, by surface grinding or lapping.
- the smoothing is performed by rotating the wafer and moving (scanning) a nozzle back and forth in the radial direction passing through the center of the wafer while supplying an etching solution from the nozzle to the surface of the wafer to etch the surface (hereafter referred to as "scan etching").
- Patent Document 1 discloses a method for determining optimal etching conditions when scan etching the surface of a wafer.
- optimal etching conditions are determined by optimization calculations using multiple etching amount distributions (hereinafter sometimes referred to as "learning data") obtained under multiple different etching conditions.
- a process is performed on a wafer W, which is a substrate obtained by cutting from an ingot, to improve the in-plane thickness uniformity.
- the cut surfaces of the wafer W are referred to as the first surface Wa and the second surface Wb.
- the first surface Wa is the surface opposite the second surface Wb.
- the first surface Wa and the second surface Wb may also be collectively referred to as the surfaces of the wafer W.
- the wafer processing system 1 has a configuration in which a loading/unloading station 2 and a processing station 3 are integrally connected.
- a loading/unloading station 2 for example, a cassette C capable of housing multiple wafers W is loaded and unloaded between the loading/unloading station 2 and the outside.
- the processing station 3 is equipped with various processing devices that perform the desired processing on the wafers W.
- the loading/unloading station 2 is provided with a cassette mounting table 10 on which multiple, for example, three cassettes C are mounted.
- a wafer transport device 20 is provided adjacent to the cassette mounting table 10 on the negative side of the X-axis of the cassette mounting table 10.
- the wafer transport device 20 is configured to be movable on a transport path 21 extending in the Y-axis direction.
- the wafer transport device 20 also has, for example, two transport arms 22 that hold and transport a wafer W.
- Each transport arm 22 is configured to be movable horizontally, vertically, around a horizontal axis, and around a vertical axis.
- the configuration of the transport arm 22 is not limited to this embodiment, and may have any configuration.
- the wafer transport device 20 is configured to be able to transport a wafer W to the cassette C on the cassette mounting table 10 and to a transition device 30 described later.
- the loading/unloading station 2 is provided with a transition device 30 adjacent to the wafer transport device 20 on the negative X-axis direction side of the wafer transport device 20 for transferring the wafer W between the processing station 3.
- the processing station 3 is provided with, for example, three processing blocks G1 to G3.
- the first processing block G1, the second processing block G2, and the third processing block G3 are arranged in this order from the positive side of the X-axis (the loading/unloading station 2 side) to the negative side.
- the first processing block G1 is provided with an etching device 40, a thickness measuring device 50, an inversion device 51, and a wafer transport device 60.
- the etching device 40, the thickness measuring device 50, and the inversion device 51 are arranged in a stacked configuration. Note that the number and arrangement of the etching devices 40, the thickness measuring devices 50, and the inversion devices 51 are not limited to this.
- the etching device 40 etches silicon (Si) on the first surface Wa or the second surface Wb after grinding by the grinding device 90 described below. In order to improve the throughput of wafer processing, multiple etching devices 40 may be provided.
- the etching device 40 has a wafer holder 41, a rotation mechanism 42, a nozzle 43, and a movement mechanism 44.
- the wafer holding part 41 holds the outer edge of the wafer W at multiple points, three points in this embodiment.
- the configuration of the wafer holding part 41 is not limited to the example shown in the figure, and for example, the wafer holding part 41 may be equipped with a chuck (not shown) that suction-holds the wafer W from below.
- the wafer holding part 41 is configured to be rotatable around a vertical rotation center line 41a by a rotation mechanism 42, thereby allowing the wafer W held on the wafer holding part 41 to be rotated.
- the nozzle 43 supplies the etching liquid E to the first surface Wa or the second surface Wb of the wafer W held by the wafer holding part 41.
- the nozzle 43 is connected to an etching liquid supply source (not shown) that supplies the etching liquid E to the nozzle 43.
- the nozzle 43 is provided above the wafer holding part 41 and configured to be movable in the horizontal and vertical directions by a moving mechanism 44. In one example, the nozzle 43 is configured to be capable of reciprocating (scanning) or rotating through the rotation center line 41a of the wafer holding part 41, that is, above the center of the wafer W as shown in FIG. 3.
- the etching solution E contains hydrofluoric acid (HF), nitric acid (HNO 3 ), and phosphoric acid (H 3 PO 4 ) to properly etch silicon of the wafer W that may be an etching target.
- the etching solution E is a mixed solution containing hydrofluoric acid, nitric acid, phosphoric acid, and water.
- the etching target may be, for example, amorphous silicon.
- the thickness measuring device 50 shown in FIG. 1 includes, in one example, a measuring unit (not shown) and a calculating unit (not shown).
- the measuring unit includes a sensor that measures the thickness of the wafer W after etching at multiple points.
- the calculating unit obtains the thickness distribution of the wafer W from the measurement results (thickness of the wafer W) by the measuring unit, and further calculates the flatness of the wafer W (TTV: Total Thickness Variation).
- the calculation of the thickness distribution and flatness of the wafer W may be performed by the control device 130 described below instead of the calculating unit.
- a calculating unit (not shown) may be provided in the control device 130 described below.
- the configuration of the thickness measuring device 50 is not limited to this, and may be configured arbitrarily.
- the inversion device 51 inverts the first surface Wa and the second surface Wb of the wafer W in the vertical direction.
- the inversion device 51 may be configured in any manner.
- the wafer transport device 60 is disposed on the negative side of the X-axis of the transition device 30.
- the wafer transport device 60 has, for example, two transport arms 61 that hold and transport the wafer W.
- Each transport arm 61 is configured to be movable horizontally, vertically, around the horizontal axis, and around the vertical axis.
- the wafer transport device 60 is configured to be able to transport the wafer W to the transition device 30, the etching device 40, the thickness measuring device 50, the inversion device 51, the cleaning device 70 described below, the thickness measuring device 71 described below, the buffer device 72 described below, and the inversion device 73 described below.
- the second processing block G2 is provided with a cleaning device 70, a thickness measuring device 71, a buffer device 72, an inversion device 73, and a wafer transport device 80.
- the cleaning device 70, the thickness measuring device 71, the buffer device 72, and the inversion device 73 are arranged in a stacked manner. Note that the number and arrangement of the cleaning devices 70, the thickness measuring devices 71, the buffer device 72, and the inversion device 73 are not limited to this.
- the cleaning device 70 cleans at least the first surface Wa or the second surface Wb after grinding by the grinding device 90 described below.
- the thickness measuring device 71 has a configuration similar to that of the thickness measuring device 50 described above. Note that the configuration of the thickness measuring device 71 is not limited to this, and can be configured as desired.
- the buffer device 72 temporarily holds the unprocessed wafer W that is transferred from the first processing block G1 to the second processing block G2.
- the configuration of the buffer device 72 is arbitrary.
- the buffer device 72 may also have an alignment mechanism (not shown) that adjusts the center position of the wafer W relative to the chucks 93a, 93b (described later) and/or the horizontal orientation of the wafer W.
- the inversion device 73 inverts the first surface Wa and the second surface Wb of the wafer W in the vertical direction.
- the configuration of the inversion device 73 is arbitrary.
- the wafer transport device 80 is disposed, for example, on the Y-axis positive side of the cleaning device 70, thickness measuring device 71, buffer device 72, and inversion device 73.
- the wafer transport device 80 has, for example, two transport arms 81 that transport the wafer W by suction and holding it with an adsorption holding surface (not shown).
- Each transport arm 81 is supported by an articulated arm member 82 and is configured to be movable horizontally, vertically, around a horizontal axis, and around a vertical axis.
- the wafer transport device 80 is configured to be able to transport the wafer W to the etching device 40, thickness measuring device 50, inversion device 51, cleaning device 70, thickness measuring device 71, buffer device 72, inversion device 73, and grinding device 90 described below.
- the third processing block G3 is provided with a grinding device 90.
- the grinding device 90 grinds and flattens the first surface Wa or the second surface Wb of the wafer W.
- the grinding device 90 has a rotating table 91.
- the rotating table 91 is configured to be freely rotatable around a vertical rotation center line 92 by a rotating mechanism (not shown).
- Four chucks 93a, 93b for suction-holding the wafer W are provided on the rotating table 91.
- the two first chucks 93a are chucks used for grinding at a first processing position B1 described later.
- These two first chucks 93a are arranged in positions that are point-symmetrical with respect to the rotation center line 92.
- the remaining two second chucks 93b are chucks used for grinding at a second processing position B2 described later.
- These two second chucks 93b are also arranged in positions that are point-symmetrical with respect to the rotation center line 92.
- the first chucks 93a and the second chucks 93b are arranged alternately in the circumferential direction.
- each of the four chucks 93a, 93b can be moved to the transfer positions A1-A2 and the processing positions B1-B2 by the rotation of the rotary table 91.
- each of the four chucks 93a, 93b is configured to be rotatable around a vertical axis by a rotation mechanism (not shown).
- the first transfer position A1 is a position on the positive X-axis side and the positive Y-axis side of the rotation center line 92 of the rotating table 91, where the wafer W is transferred to the first chuck 93a when grinding the first surface Wa.
- the second transfer position A2 is a position on the positive X-axis side and the negative Y-axis side of the rotation center line 92 of the rotating table 91, where the wafer W is transferred to the second chuck 93b when grinding the second surface Wb.
- the first processing position B1 is a position on the negative X-axis and negative Y-axis side of the rotation center line 92 of the rotating table 91, and the first grinding unit 100 is disposed therein.
- the first grinding unit 100 has a grinding section 101 equipped with a grinding wheel (not shown) that is annular and can rotate freely.
- the grinding section 101 is also configured to be movable in the vertical direction along the support 102. As an example, the first grinding unit 100 grinds the first surface Wa or the second surface Wb of the wafer W held by the first chuck 93a.
- the second processing position B2 is a position on the negative X-axis side and the positive Y-axis side of the rotation center line 92 of the rotating table 91, and the second grinding unit 110 is disposed thereat.
- the second grinding unit 110 has a grinding section 111 equipped with a grinding wheel (not shown) that is annular and can rotate freely.
- the grinding section 111 is also configured to be movable in the vertical direction along the support 112. As an example, the second grinding unit 110 grinds the second surface Wb or the first surface Wa of the wafer W held by the second chuck 93b.
- a thickness measuring device (not shown) for measuring the thickness of the wafer W after grinding may be provided at the transfer positions A1, A2 or the processing positions B1, B2.
- the above-described wafer processing system 1 is provided with a display panel 120.
- the display panel 120 is, for example, a monitor or a touch panel, and may be attached directly to the wafer processing system 1 or may be capable of being viewed remotely.
- the display panel 120 displays a screen for operating each process performed in the wafer processing system 1.
- a signal representing the result of the operation on the display panel 120 is output to the control device 130, which will be described later.
- the above wafer processing system 1 is provided with at least one controller 130.
- the controller 130 processes computer-executable instructions that cause the wafer processing system 1 to perform the various steps described in this disclosure.
- the controller 130 may be configured to control each element of the wafer processing system 1 to perform the various steps described herein. In one embodiment, some or all of the controller 130 may be included in the wafer processing system 1.
- the controller 130 may include a processing unit, a storage unit, and a communication interface.
- the controller 130 is realized, for example, by a computer.
- the processing unit may be configured to read a program that provides logic or routines that enable various control operations to be performed from the storage unit, and to perform various control operations by executing the read program. This program may be stored in the storage unit in advance, or may be acquired via a medium when necessary.
- the acquired program is stored in the storage unit, and is read from the storage unit by the processing unit and executed.
- the medium may be various computer-readable storage media, or may be a communication line connected to the communication interface.
- the storage medium may be temporary or non-temporary.
- the processing unit may be a CPU (Central Processing Unit) or one or more circuits.
- the storage unit may include a RAM (Random Access Memory), a ROM (Read Only Memory), a HDD (Hard Disk Drive), an SSD (Solid State Drive), or a combination thereof.
- the communication interface may communicate with the wafer processing system 1 via a communication line such as a LAN (Local Area Network).
- processing is performed on a wafer W cut from an ingot using a wire saw or the like, or on a lapped wafer W, to improve the in-plane thickness uniformity.
- a cassette C containing multiple wafers W is placed on the cassette placement table 10 of the loading/unloading station 2.
- the wafers W are stored with their first surfaces Wa facing upward and their second surfaces Wb facing downward.
- the wafers W in the cassette C are removed by the wafer transfer device 20 and transferred to the transition device 30.
- the wafers W transferred to the transition device 30 are then transferred to the buffer device 72 by the wafer transfer device 60.
- the wafer W is transported by the wafer transport device 80 to the grinding device 90 and transferred to the first chuck 93a at the first transfer position A1.
- the second surface Wb of the wafer W is held by suction in the first chuck 93a.
- the rotary table 91 is rotated to move the wafer W to the first processing position B1. Then, the first surface Wa is ground by the first grinding unit 100 (St1 in FIG. 4).
- the rotary table 91 is rotated to move the wafer W to the first transfer position A1.
- the wafer W is then transported by the wafer transport device 80 to the cleaning device 70.
- the cleaning device 70 the first surface Wa of the wafer W is cleaned (St2 in FIG. 4).
- the second surface Wb of the wafer W may also be cleaned.
- the wafer W is transported to the inversion device 73 by the wafer transport device 80.
- the first surface Wa and the second surface Wb of the wafer W are inverted vertically (St3 in FIG. 4). That is, the wafer W is inverted so that the first surface Wa faces downward and the second surface Wb faces upward.
- the wafer W is transported by the wafer transport device 80 to the grinding device 90 and transferred to the second chuck 93b at the second transfer position A2.
- the first surface Wa of the wafer W is held by suction in the second chuck 93b.
- the rotary table 91 is rotated to move the wafer W to the second processing position B2. Then, the second surface Wb of the wafer W is ground by the second grinding unit 110 (St4 in FIG. 4).
- the rotary table 91 is rotated to move the wafer W to the second transfer position A2.
- the wafer W is transported by the wafer transport device 80 to the thickness measuring device 71.
- the thickness measuring device 71 measures the thickness of the wafer W after grinding on both the first surface Wa and the second surface Wb at multiple points to obtain the thickness distribution of the wafer W (St5 in FIG. 4).
- the thickness measuring device 71 may further calculate the flatness of the wafer W.
- the obtained thickness distribution of the wafer W is output to, for example, the control device 130, and is used, for example, in the processing of another wafer W that is subsequently processed in the wafer processing system 1. Note that if the grinding device 90 is provided with a thickness measuring device, the thickness of the wafer W after grinding may be measured by the thickness measuring device of the grinding device 90.
- the wafer W is transported by the wafer transport device 80 to the cleaning device 70.
- the cleaning device 70 the second surface Wb of the wafer W is cleaned (St6 in FIG. 4).
- the first surface Wa of the wafer W may also be cleaned.
- the wafer W is then transported by the wafer transport device 60 to the etching device 40.
- the second surface Wb of the wafer W is etched with the etching solution E under predefined etching conditions (St7 in FIG. 4).
- the second surface Wb is etched under the predefined etching conditions to process the second surface Wb into a target shape.
- the wafer W is transported to the inversion device 51 by the wafer transport device 60.
- the first surface Wa and the second surface Wb of the wafer W are inverted vertically (St8 in FIG. 4). That is, the wafer W is inverted so that the first surface Wa faces upward and the second surface Wb faces downward.
- the wafer W is transported by the wafer transport device 60 to the thickness measurement device 50.
- the thickness of the wafer W after etching is measured at multiple points on the second surface Wb to obtain the thickness distribution of the wafer W, and further calculates the flatness of the wafer W (St9 in FIG. 4).
- the calculated thickness distribution and flatness of the wafer W are output to, for example, the control device 130.
- the control device 130 performs optimization processing based on the thickness distribution and flatness of the wafer W calculated in St9 and output to the control device 130, optimizing the etching amount distribution (etching profile) in the etching process of the first surface Wa and determining the optimal etching conditions for the first surface Wa (St10 in FIG. 4).
- the etching amount is the amount of the wafer W removed by etching
- the etching amount distribution is the distribution of the etching amount in the radial direction (within the wafer surface) of the wafer W. The method of determining the optimal etching conditions for the first surface Wa in the control device 130 will be described later.
- the wafer W is then transported by the wafer transport device 60 to the etching device 40.
- the first surface Wa of the wafer W is etched with the etching solution E under the optimal etching conditions determined in St10 (St11 in FIG. 4).
- St11 the first surface Wa is etched under the optimal etching conditions to optimize the etching amount distribution and process the first surface Wa into the target shape.
- the thickness measurement device 50 measures the thickness of the wafer W after etching at multiple points on both the first surface Wa and the second surface Wb to obtain the thickness distribution of the wafer W (St12 in FIG. 4). The thickness measurement device 50 may further calculate the flatness of the wafer W.
- the obtained thickness distribution of the wafer W is output to, for example, the control device 130, and is used, for example, in the processing of another wafer W that is next processed in the wafer processing system 1.
- the wafer W that has been subjected to all the processes is transferred to the cassette C on the cassette mounting table 10 via the transition device 30. This completes the series of wafer processing steps in the wafer processing system 1.
- the first surface Wa is ground in St1
- the second surface Wb is ground in St4
- the order of grinding these surfaces may be reversed.
- the second surface Wb is etched in St7
- the first surface Wa is etched in St11, but the order of etching these surfaces may be reversed.
- the etching of the first surface Wa in St11 is performed under the optimal etching conditions determined in St10, but instead, it may be performed under predetermined default etching conditions. In such a case, St9 and St10 in this embodiment are omitted.
- the etching of the second surface Wb in St7 is performed under predetermined default etching conditions, but instead, it may be performed under optimal etching conditions.
- the optimal etching conditions are determined in the same way as in St10.
- the learning data is the distribution of the amount of etching of the wafer W under certain etching conditions.
- etching is performed on the dummy wafer under, for example, a plurality of different etching conditions.
- the dummy wafer is etched by changing, for example, the rotation speed R (also called the number of rotations) of the dummy wafer during etching, the scan speed V (also called the swing speed) of the nozzle 43, the scan width L (see the scan width L in FIG. 3, also called the swing radius) of the nozzle 43, or the number of loops N of the nozzle 43.
- the etching process time for each dummy wafer is the same.
- the dummy wafer is etched by rotating the dummy wafer and supplying etching solution E from the nozzle 43 to the dummy wafer while moving the nozzle 43 back and forth, as in the etching in St11.
- the back and forth movement of the nozzle 43 between both ends of the dummy wafer is considered as one loop.
- the etching of the dummy wafer under each etching condition is carried out for a predetermined desired time (desired number of loops). Then, the etching amount distribution of the dummy wafer is acquired, and this etching amount distribution is output to the control device 130. Furthermore, the control device 130 compresses the output etching amount distribution under each etching condition into an etching amount distribution per unit time (unit number of loops), and stores each compressed etching amount distribution as the above-mentioned learning data.
- a learning data acquisition screen 200 When learning data is acquired in St100, a learning data acquisition screen 200 is displayed on the display panel 120 as shown in FIG. 6.
- the learning data acquisition screen 200 displays a list 201 of etching conditions when acquiring learning data.
- the list 201 of etching conditions displays, for example, the ID of the learning data, the rotation speed R, the scan speed V, the scan width L, the number of loops N, etc.
- the learning data acquisition screen 200 also displays an add button 202 for adding learning data.
- an etching condition input screen (not shown) is displayed on the display panel 120.
- the etching condition input screen displays multiple preset values for each condition, such as the rotation speed R, scan speed V, scan width L, and loop count N, allowing the user to select the value for each condition.
- the etching condition input screen may be configured so that the user can directly input, for example, the rotation speed R, scan speed V, scan width L, and loop count N.
- the etching conditions entered on the etching condition input screen are displayed in a list 201 of etching conditions on the learning data acquisition screen 200.
- the learning data acquisition screen 200 also displays a delete button 203 for deleting learning data.
- a delete button 203 for example, a learning data deletion screen (not shown) for the learning data to be deleted is displayed.
- multiple learning data IDs are displayed on the learning data deletion screen, allowing the user to select the learning data ID to be deleted.
- the etching conditions for that learning data ID are deleted from the list of etching conditions 201 on the learning data acquisition screen 200.
- learning data acquisition screen 200 shown in FIG. 6 is an example, and other items may be displayed.
- the etching target when obtaining the learning data is not limited to a dummy wafer.
- the etching process result of a product wafer W processed by the wafer processing system 1 may be stored as the learning data.
- the etching target may be the film, and the etching process result of the film may be stored as the learning data.
- the control device 130 determines the optimal etching conditions based on multiple pieces of learning data acquired outside the wafer processing system 1.
- a screening process is performed on the multiple learning data (etching amount distributions) acquired in St100, and at least one of unnecessary etching amount distributions and similar etching amount distributions is removed in St111 described below, to select multiple valid learning data (St101 in FIG. 5).
- the etching amount distribution of the valid learning data may be referred to as the "valid etching amount distribution.” The method of screening multiple learning data in St101 will be described later.
- the target etching amount distribution in the etching process in St11 is obtained (St110 in Figure 5).
- the target etching amount distribution in the etching process can be obtained, as an example, by calculating the difference between the thickness distribution in the target shape of the wafer W and the thickness distribution in the actual shape.
- an optimization method (optimization calculation) is used to optimize the effective learning data used in the overlapping and the number of overlapping times of the effective learning data so as to overlap multiple pieces of effective learning data (effective etching amount distribution) to achieve the target etching amount distribution obtained in St110 (St111 in FIG. 5).
- the control of the effective etching amount distribution is applied to a knapsack problem to optimize the number of times that the effective learning data and the effective learning data are overlapped.
- the etching amount distribution is the knapsack of the knapsack problem
- the effective learning data is the items of the knapsack problem. Then, the number of times that the effective learning data and the effective learning data are overlapped is optimized so that the difference between the overlapped effective etching amount distribution and the target etching amount distribution of St110 is minimized.
- the etching amount distribution during etching of the first surface Wa in St11 is optimized.
- the etching conditions corresponding to the effective learning data optimized in St111 are integrated to determine the optimal etching conditions (St112 in FIG. 5).
- the optimal etching conditions are determined by integrating the multiple selected etching conditions so that the multiple etching conditions are performed with an optimized number of overlaps. In other words, the optimal etching conditions that optimize the etching amount distribution are determined.
- the optimal etching conditions for the first surface Wa in St10 are determined.
- the etching amount distribution can be optimized and the first surface Wa can be processed into the target shape.
- the optimal etching conditions for the first surface Wa determined in St10 are stored in the control device 130, and the history of the etching conditions remains in the control device 130. At this time, the learning data used to determine the optimal etching conditions is also stored. In addition, the optimal etching conditions for the first surface Wa may be displayed on an etching condition history screen (not shown) on the display panel 120.
- the etching of the first surface Wa in St11 may be performed under predetermined etching conditions rather than the optimal etching conditions. For this reason, when setting the etching conditions, the user may be allowed to select whether or not to use the learning data.
- a learning data selection screen 210 is displayed on the display panel 120.
- a learning button 211 and a correction/non-correction button 212 are displayed on the learning data selection screen 210.
- the learning button 211 When the user presses the learning button 211, the use of learning data when etching the first surface Wa is selected.
- the correction/non-correction button 212 When the user presses the correction/non-correction button 212, the etching conditions are corrected when etching the first surface Wa to determine optimal etching conditions. Then, it is determined whether the etching of the first surface Wa is performed under optimal etching conditions or default etching conditions.
- the learning data selection screen 210 shown in FIG. 7 is just an example, and other items may be displayed.
- the first pattern is a method using a geometric method
- the second pattern is a method using a graph method
- the third pattern is a method using a QR decomposition method.
- an etching amount distribution vector is obtained whose components are the etching amounts of multiple measurement points in the etching amount distribution of the learning data.
- an etching amount distribution matrix A is obtained as the etching amount distribution vector (St200 in FIG. 8).
- the etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m.
- the dimension of the etching amount distribution matrix A acquired in St200 is compressed (St201 in FIG. 8).
- the dimension of the etching amount distribution matrix A is compressed from n to r to obtain a matrix A r of (r, m).
- Any method for dimensional compression may be used, and for example, low-rank approximation such as singular value decomposition (SVD) or principal component analysis (PCA) may be used.
- the r dimension may be set arbitrarily.
- the convex hull is the smallest convex polygon (convex polyhedron) that includes all the points of the etching amount distribution matrix A r .
- a convex hull algorithm is used to obtain a focal set of the convex hull of a solid (polygon) spanned by the etching amount distribution matrix A r ⁇ a 0 , a 1 , ..., a m ⁇ , that is, an r-dimensional polytope (hyperpolyhedron).
- the convex hull algorithm is arbitrary, and a known algorithm is used.
- Fig. 9 shows an example of the convex hull acquired in St 202.
- Fig. 9 shows a schematic convex hull when the etching amount distribution vector ⁇ a0 , a1 , a2 , a3 , a4 , a5 ⁇ in which the number of measurement points n is 6 is compressed into two dimensions.
- the etching amount distributions present inside the convex hull are removed, and multiple effective etching amount distributions (multiple effective learning data) are selected (St203 in Figure 8). Since the etching amount distribution optimized in St10 is a temporary combination of the learning data (etching amount distributions), a feasible solution in the optimization process of St10 exists inside the convex hull. Note that a feasible solution is a solution in a feasible region in the search space where the design variables and objective function values satisfy the constraint conditions. In this case, it is possible to remove etching amount distributions (learning data) that do not affect the optimization performance of the etching amount distribution in St10, i.e., data that is unnecessary for the optimization process.
- the convex hull is a polygon spanned by six etching amount distribution vectors, and the etching amount distribution vector a5 inside the convex hull is removed.
- the etching amount distribution vector a5 can be expressed as a linear combination of the etching amount distribution vectors a0 and a1 , for example, and is therefore removed.
- St200 to St203 are performed as described above, and etching amount distributions that are not necessary for the optimization process of etching amount distribution in St10 are removed, and multiple valid learning data are selected.
- FIG. 10 is an explanatory diagram showing how multiple learning data are screened using the geometric method of the first pattern.
- FIG. 10(a) shows multiple learning data before screening
- FIGS. 10(b) and (c) show multiple valid learning data after screening.
- the horizontal axis of FIG. 10 indicates the radial position from the center of the wafer (0 (zero) on the horizontal axis) to the outer periphery
- the vertical axis indicates the etching amount.
- the wafer W is, for example, a wafer with a diameter of 300 mm, but is not limited to this.
- the numerical values of the etching amount are examples and are not limited to this.
- the number of learning data shown in FIG. 10(a) is 27, while the number of valid learning data shown in FIG. 10(b) is 23, and the number of valid learning data shown in FIG. 10(c) is 20. Therefore, when the first pattern of geometric method is used, valid learning data can be appropriately selected. Furthermore, the smaller the dimension r compressed in the etching amount distribution matrix, the smaller the number of valid learning data, and the more appropriately the valid learning data can be selected.
- the calculation time required for the optimization calculation in St111 in the optimization process of the etching amount distribution in St10 will be long. In other words, the more learning data there is, the longer the calculation time required for the optimization calculation.
- the throughput of wafer processing may decrease.
- the thickness measurement device 50 may not be able to measure the thickness of the next wafer W in St9 while the optimization calculation in St111 is being performed. In such cases, the waiting time for the next wafer W becomes longer, and the throughput of wafer processing decreases.
- the optimization calculation may not finish.
- a phenomenon known as combinatorial explosion may occur, and a solution may not be found.
- the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for the optimization calculation can be shortened. Therefore, the decrease in throughput of the wafer processing described above can be suppressed, and the throughput can be improved.
- the optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions. And, when learning data for new etching conditions is added, the reliability of the optimization process for the etching amount distribution of St10 can be improved, and the optimization accuracy (estimation accuracy) can be improved.
- the calculation time for the optimization calculation can be shortened, or in other words, it is possible to increase the amount of learning data acquired in the original St100. In such a case, it is possible to improve the reliability of the optimization process of the etching amount distribution of St10, and improve the optimization accuracy.
- the optimization accuracy in the optimization process of the etching amount distribution is likely to change.
- the learning data removed in St203 can be replaced with a combination of other learning data, so that the optimization accuracy in the optimization process of the etching amount distribution in St10 can be maintained.
- the removed etching amount distribution vector a5 can be replaced with a combination of etching amount distribution vectors a0 and a1 .
- dimensional compression of the etching amount distribution matrix of St201 is not essential, and St201 may be omitted.
- St201 may be omitted.
- an etching amount distribution matrix A is obtained as an etching amount distribution vector (St300 in FIG. 11).
- the etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m.
- the method of obtaining the etching amount distribution matrix A in St300 is the same as in St200, so a detailed explanation will be omitted.
- the dimension of the etching amount distribution matrix A acquired in St300 is compressed to acquire an r-dimensional etching amount distribution matrix A r (St301 in FIG. 11).
- the dimension compression method in St301 is the same as that in St201, and therefore a detailed description thereof will be omitted.
- the similarity or dissimilarity between columns of the etching amount distribution matrix A r that has been dimension-compressed in St301, i.e., between etching amount distribution vectors, is calculated (St302 in FIG. 11).
- the method for calculating the similarity or dissimilarity in St302 is arbitrary, and a known method is used.
- the dissimilarity is calculated in St302.
- the dissimilarity ⁇ u k -u l ⁇ 2 is calculated between columns of the etching amount distribution matrix A r .
- the L 2 norm of the cross product takes a large value, and can be regarded as a dissimilarity.
- a first complete graph is obtained in which the etching conditions are the vertices (nodes) and the dissimilarity is the weight of the edge (St303 in FIG. 11).
- the first complete graph is a simple graph in which every two dissimilar vertices are adjacent, that is, a complete undirected graph in which all vertices are connected by edges.
- FIG. 12(a) shows an example of the first complete graph obtained in St303. Note that the vertices in the first complete graph may be etching amount distributions instead of etching conditions. Also, the edges in the first complete graph may be similarities instead of dissimilarity.
- edges whose dissimilarity is equal to or less than the edge cut parameter s are removed to obtain a second complete graph (St304 in FIG. 11).
- the edge cut parameter s is a predetermined threshold and can be determined arbitrarily.
- FIG. 12(b) shows an example of the second complete graph obtained in St304. Note that, when similarity is used for the edges of the first complete graph, in St304, edges whose dissimilarity is equal to or more than the predetermined threshold are removed to obtain the second complete graph.
- the maximum clique problem is solved to find the vertex set of the maximum clique, and the etching amount distribution corresponding to the vertices included in the vertex set is selected as the effective etching amount distribution (effective learning data) (St305 in FIG. 11).
- the maximum clique problem is a type of optimization problem that finds the vertex set with the largest number of vertices that induces a complete graph in a simple undirected graph, and the vertex set of the maximum clique is found by solving this maximum clique problem.
- the vertices of the second complete graph are etching conditions, and the etching amount distribution corresponding to the etching conditions included in the vertex set is set as the effective etching amount distribution. Note that if the vertices of the second complete graph are etching amount distributions, the vertices included in the vertex set become the effective etching amount distribution as they are.
- Figure 12(c) shows an example of the vertex set of the maximum clique obtained in St305.
- the vertices painted in black are the vertex set of the maximum clique, and the etching amount distribution corresponding to the vertices included in this vertex set is selected as the effective etching amount distribution.
- Steps 300 to 205 are performed as described above, similar etching amount distributions are eliminated, and multiple valid learning data are selected.
- FIG. 13 is an explanatory diagram showing how multiple pieces of training data are screened using the second pattern of the graph method.
- FIG. 13(a) shows multiple pieces of training data before screening
- FIGS. 13(b) and (c) show multiple pieces of valid training data after screening.
- the number of training data shown in FIG. 13(a) is 27, whereas the number of valid training data shown in FIG. 13(b) is 18, and the number of valid training data shown in FIG. 10(c) is 11. Therefore, when the second pattern of the graph method is used, valid training data can be appropriately selected. Furthermore, the larger the dissimilarity edge cut parameter s is, the smaller the number of valid training data becomes, and the more appropriately valid training data can be selected.
- the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for the optimization calculation can be shortened. In other words, similar to the first pattern of the geometric method, the throughput of wafer processing can be improved. In addition, the optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions.
- both sets of learning data may be adopted, resulting in multiple combinations.
- the expression of the etching amount distribution when switching etching conditions (leaves) lacks accuracy, so the more combinations there are, the larger the optimization error (estimation error) may become.
- dimensional compression of the etching amount distribution matrix of St301 is not essential, and St301 may be omitted.
- the etching amount distribution matrix A is obtained (St400 in FIG. 14).
- the etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m.
- the method of obtaining the etching amount distribution matrix A in St400 is the same as that in St200, so a detailed explanation will be omitted.
- a sensor placement problem for determining optimal sensor positions for multiple sensors as a method for screening multiple training data.
- a sensor set is determined for a sensor placement matrix such that the minimum singular value is maximized under the constraint that the number of sensor sets is a desired number p.
- a sensor set is determined for which the sum of the singular values of the sensor placement matrix is maximized (the volume of a p-dimensional solid is maximized).
- the present inventors have conducted extensive research and have come up with the idea of performing pivot selection QR decomposition on the sensor arrangement matrix, i.e., the etching amount distribution matrix A, as an efficient calculation method. That is, the sum of the singular values of the above-mentioned etching amount distribution matrix A is equal to the sum of the diagonal elements r ii of the upper triangular matrix R obtained by QR decomposing the etching amount distribution matrix A, as shown in the following formula (1).
- the QR decomposition decomposes the (n, m) etching amount distribution matrix A into the product of an n-th order orthogonal matrix Q and an upper triangular matrix R of (n, m).
- the diagonal elements r ii of the upper triangular matrix R are in descending order, that is, in descending order of contribution to the singular values.
- the pivot is the leftmost non-zero value in a row of the etching amount distribution matrix A.
- the pivot selection is to interchange the rows or columns of the etching amount distribution matrix A so that the value does not become 0 (zero) or a small value.
- the pivot selection matrix P is a column that stores the row numbers after the pivot selection.
- QR decomposition with pivot selection is performed on the etching amount distribution matrix A acquired in St400 (St401 in FIG. 14).
- the pivot selection matrix P and the total power of the diagonal elements r ii of the upper triangular matrix R are obtained (St402 in FIG. 14).
- the total power of the diagonal elements r ii is set to the value shown in the following formula (3) in order to reduce the number of digits of the calculation.
- the diagonal elements r ii are automatically arranged in ascending order.
- Step 403 the effective total product of the diagonal elements of the upper triangular matrix R, excluding the tail r nn , is obtained (Step 403 in FIG. 14).
- the effective total product of the diagonal elements obtained in Step 403 is expressed by the following formula (4).
- Step 404 in FIG. 14 it is determined whether the effective product of the diagonal elements expressed by the above formula (4) is equal to or less than a predetermined threshold.
- the threshold in Step 404 can be determined arbitrarily.
- step 404 if the effective product of the diagonal elements expressed by the above formula (4) is equal to or less than a predetermined threshold, the etching amount distribution corresponding to the end of the pivot selection matrix P is removed (step 405 in FIG. 14). Then, the process returns to step 403.
- the QR decomposition method of the third pattern When the QR decomposition method of the third pattern is used, the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for optimization calculation can be shortened. In other words, similar to the geometric method of the first pattern and the graph method of the second pattern, the throughput of wafer processing can be improved. In addition, optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions.
- the dimension of the etching amount distribution matrix A in St400 may be compressed to obtain an r-dimensional etching amount distribution matrix A r .
- This dimension compression method is the same as that in St201. Then, in and after St401, the QR decomposition and other processes are performed using the dimension-compressed etching amount distribution matrix A r .
- first pattern of geometric method and second pattern of graphical method may be combined to screen multiple learning data.
- steps St200 to St203 are performed to select a first effective etching amount distribution (first effective learning data).
- steps St300 to St305 are performed using the first effective etching amount distribution to select a second effective etching amount distribution (second effective learning data).
- the first pattern geometric method can remove data that is not necessary for the optimization process of the etching amount distribution of St10, and the second pattern graphical method can also remove similar etching amount distributions. Therefore, it is possible to more appropriately select valid learning data.
- the order of the first pattern geometric method and the second pattern graphical method is not limited to this embodiment, and the first pattern geometric method may be performed after the second pattern graphical method.
- first pattern of geometric method and the third pattern of QR decomposition method may be combined to screen multiple learning data.
- first pattern of geometric method St200 to St203 are performed to select a first effective etching amount distribution (first effective learning data).
- St400 to St406 are performed using the first effective etching amount distribution to select a second effective etching amount distribution (second effective learning data).
- the geometric method of the first pattern can remove data that is not necessary for the optimization process of the etching amount distribution of St10, and further, the QR decomposition method of the third pattern can remove similar etching amount distributions. Therefore, it is possible to more appropriately select valid learning data.
- the order of the geometric method of the first pattern and the QR decomposition method of the third pattern is not limited to this embodiment, and the geometric method of the first pattern may be performed after the QR decomposition method of the third pattern.
- the etching amount distribution is used as the etching index distribution (learning data) for controlling the etching process of the wafer W, but the etching amount deviation distribution may also be used.
- the etching amount deviation distribution is a distribution of values obtained by subtracting the average value of the etching amount from the etching amount within the wafer surface. In such a case, when determining the optimal etching conditions in St10, the etching amount deviation distribution is used instead of the etching amount distribution.
- various processes are performed on a wafer W that has been cut from an ingot using a wire saw or lapped, but the technology disclosed herein can also be applied to post-processing steps in the manufacturing process of semiconductor devices. Specifically, the technology disclosed herein can also be applied to a laminated wafer formed by bonding a first wafer and a second wafer, in which the first wafer is ground and then the surface of the ground first wafer is etched.
Landscapes
- Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- Computer Hardware Design (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Power Engineering (AREA)
- Physics & Mathematics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- General Physics & Mathematics (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
Abstract
Description
本開示は、基板処理方法及び基板処理システムに関する。 This disclosure relates to a substrate processing method and a substrate processing system.
特許文献1には、基板の表面をエッチングする際の、最適エッチング条件の決定方法が開示されている。かかる方法では、先ず、複数の異なるエッチング条件で基板の表面をエッチングした際の、径方向のエッチング量分布を取得する。次に、最適化手法を用いて、エッチング量分布を重ね合わせて基板の表面の形状が目標形状になるように、重ね合わせに用いるエッチング量分布と、当該エッチング量分布を重ね合わせる回数との組み合わせを最適化する。次に、最適化された組み合わせに対応するエッチング条件を統合して最適エッチング条件を決定する。
本開示にかかる技術は、基板の表面をエッチングする際のエッチング条件を効率よく最適化する。 The technology disclosed herein efficiently optimizes the etching conditions when etching the surface of a substrate.
本開示の一態様は、基板を処理する基板処理方法であって、エッチング量分布の最適化処理を行い、最適エッチング条件を決定することと、前記最適エッチング条件に基づいて、基板の表面にエッチング液を供給して、当該表面をエッチングすることと、を含み、前記最適エッチング条件を決定することは、複数の異なるエッチング条件で基板の表面をエッチングした際の、径方向の複数のエッチング量分布を取得することと、前記複数のエッチング量分布に対してスクリーニング処理を行い、前記最適化処理に不要なエッチング量分布と、類似するエッチング量分布との少なくともいずれかを除去して、複数の有効エッチング量分布を選定することと、最適化手法を用いて、前記複数の有効エッチング量分布を重ね合わせて、基板の表面の形状が目標形状になるように、重ね合わせに用いる前記有効エッチング量分布と、当該有効エッチング量分布を重ね合わせる回数との組み合わせを最適化することと、前記最適化された組み合わせに対応するエッチング条件を統合して前記最適エッチング条件を決定することと、を含む。 One aspect of the present disclosure is a substrate processing method for processing a substrate, comprising: optimizing an etching amount distribution to determine optimal etching conditions; and supplying an etching solution to a surface of the substrate based on the optimal etching conditions to etch the surface. Determining the optimal etching conditions includes obtaining multiple radial etching amount distributions when the surface of the substrate is etched under multiple different etching conditions; screening the multiple etching amount distributions to remove at least one of an etching amount distribution unnecessary for the optimization process and a similar etching amount distribution to select multiple effective etching amount distributions; superimposing the multiple effective etching amount distributions using an optimization method to optimize a combination of the effective etching amount distribution used for superimposition and the number of times the effective etching amount distributions are superimposed so that the shape of the surface of the substrate becomes a target shape; and determining the optimal etching conditions by integrating the etching conditions corresponding to the optimized combination.
本開示によれば、基板の表面をエッチングする際のエッチング条件を効率よく最適化することができる。 According to this disclosure, etching conditions can be efficiently optimized when etching the surface of a substrate.
半導体デバイスの製造工程では、単結晶シリコンインゴットからワイヤーソー等により切り出して得られた円盤状のシリコンウェハ(以下、「ウェハ」という。)の切断面を平坦化し、更に平滑化してウェハの厚みを均一化することが行われている。切断面の平坦化は、例えば平面研削又はラッピングにより行われる。平滑化は、例えばウェハを回転させるとともに、ノズルをウェハの中心を通る径方向に往復移動(スキャン)させながら、ノズルからウェハの表面にエッチング液を供給して当該表面をエッチングする(以下、「スキャンエッチング」という。)。 In the manufacturing process of semiconductor devices, the cut surface of a disk-shaped silicon wafer (hereafter referred to as "wafer") obtained by cutting a single crystal silicon ingot with a wire saw or the like is flattened and further smoothed to make the thickness of the wafer uniform. The cut surface is flattened, for example, by surface grinding or lapping. For example, the smoothing is performed by rotating the wafer and moving (scanning) a nozzle back and forth in the radial direction passing through the center of the wafer while supplying an etching solution from the nozzle to the surface of the wafer to etch the surface (hereafter referred to as "scan etching").
上述した特許文献1には、ウェハの表面をスキャンエッチングする際の、最適エッチング条件を決定する方法が開示されている。かかる方法では、複数の異なるエッチング条件で取得される複数のエッチング量分布(以下、「学習データ」という場合がある。)を用いて、最適化計算により最適エッチング条件を決定する。
The above-mentioned
しかしながら、特許文献1に開示の方法では、すべての学習データを用いて最適化計算を行うため、例えば学習データの数が多い場合、最適化計算の計算時間が長くなる。したがって、従来の最適エッチング条件の決定方法には改善の余地がある。
However, in the method disclosed in
本開示にかかる技術は、基板の表面をエッチングする際のエッチング条件を効率よく最適化する。以下、本実施形態にかかる基板処理システムとしてのウェハ処理システム、及び基板処理方法としてのウェハ処理方法について、図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する要素においては、同一の符号を付することにより重複説明を省略する。 The technology disclosed herein efficiently optimizes the etching conditions when etching the surface of a substrate. Below, a wafer processing system as a substrate processing system and a wafer processing method as a substrate processing method according to this embodiment will be described with reference to the drawings. Note that in this specification and the drawings, elements having substantially the same functional configuration are denoted with the same reference numerals to avoid redundant description.
本実施形態にかかるウェハ処理システム1では、インゴットから切り出して得られた基板としてのウェハWに対し、厚みの面内均一性を向上させるための処理を行う。以下、ウェハWの切り出し面を第1の表面Waと第2の表面Wbという。第1の表面Waは第2の表面Wbの反対側の面である。また、第1の表面Waと第2の表面Wbを総称してウェハWの表面という場合がある。
In the
図1に示すようにウェハ処理システム1は、搬入出ステーション2と処理ステーション3を一体に接続した構成を有している。搬入出ステーション2では、例えば外部との間で複数のウェハWを収容可能なカセットCが搬入出される。処理ステーション3は、ウェハWに対して所望の処理を施す各種処理装置を備えている。
As shown in FIG. 1, the
搬入出ステーション2には、複数、例えば3つのカセットCを載置するカセット載置台10が設けられている。また、カセット載置台10のX軸負方向側には、当該カセット載置台10に隣接してウェハ搬送装置20が設けられている。ウェハ搬送装置20は、Y軸方向に延伸する搬送路21上を移動自在に構成されている。また、ウェハ搬送装置20は、ウェハWを保持して搬送する、例えば2つの搬送アーム22を有している。各搬送アーム22は、水平方向、鉛直方向、水平軸回り及び鉛直軸周りに移動自在に構成されている。なお、搬送アーム22の構成は本実施形態に限定されず、任意の構成を取り得る。そして、ウェハ搬送装置20は、カセット載置台10のカセットC、及び後述するトランジション装置30に対して、ウェハWを搬送可能に構成されている。
The loading/
搬入出ステーション2には、ウェハ搬送装置20のX軸負方向側において、当該ウェハ搬送装置20に隣接して、ウェハWを処理ステーション3との間で受け渡すためのトランジション装置30が設けられている。
The loading/
処理ステーション3には、例えば3つの処理ブロックG1~G3が設けられている。第1の処理ブロックG1、第2の処理ブロックG2、及び第3の処理ブロックG3は、X軸正方向側(搬入出ステーション2側)から負方向側にこの順で並べて配置されている。
The
第1の処理ブロックG1には、エッチング装置40、厚み測定装置50、反転装置51及びウェハ搬送装置60が設けられている。エッチング装置40、厚み測定装置50及び反転装置51は、積層して配置されている。なお、エッチング装置40、厚み測定装置50及び反転装置51の数や配置はこれに限定されない。
The first processing block G1 is provided with an
エッチング装置40は、後述の研削装置90で研削後の第1の表面Wa又は研削後の第2の表面Wbのシリコン(Si)をエッチングする。ウェハ処理のスループットを向上させるため、エッチング装置40は複数設けられていてもよい。
The
図2に示すようにエッチング装置40は、ウェハ保持部41、回転機構42、ノズル43及び移動機構44を有している。
As shown in FIG. 2, the
ウェハ保持部41は、ウェハWの外縁部を複数点、本実施形態においては3点で保持する。なお、ウェハ保持部41の構成は図示の例には限定されず、例えばウェハ保持部41は、ウェハWを下方から吸着保持するチャック(図示せず)を備えていてもよい。ウェハ保持部41は、回転機構42によって鉛直な回転中心線41aを中心に回転可能に構成され、これによりウェハ保持部41上に保持されたウェハWを回転可能に構成されている。
The
ノズル43は、ウェハ保持部41に保持されたウェハWの第1の表面Wa又は第2の表面Wbにエッチング液Eを供給する。ノズル43は、当該ノズル43にエッチング液Eを供給するエッチング液供給源(図示せず)に接続されている。ノズル43は、ウェハ保持部41の上方に設けられ、移動機構44によって水平方向及び鉛直方向に移動可能に構成されている。一例においてノズル43は、ウェハ保持部41の回転中心線41aを通って、すなわち、図3に示すようにウェハWの中心部上方を通って往復移動(スキャン移動)可能、または旋回可能に構成される。
The
エッチング液Eには、エッチング対象となり得るウェハWのシリコンを適切にエッチングするため、フッ酸(HF)、硝酸(HNO3)及びリン酸(H3PO4)が含まれている。一例においてエッチング液Eは、フッ酸、硝酸、リン酸及び水を含有する混合液である。なお、エッチング対象は、例えばアモルファスシリコンでもよい。 The etching solution E contains hydrofluoric acid (HF), nitric acid (HNO 3 ), and phosphoric acid (H 3 PO 4 ) to properly etch silicon of the wafer W that may be an etching target. In one example, the etching solution E is a mixed solution containing hydrofluoric acid, nitric acid, phosphoric acid, and water. The etching target may be, for example, amorphous silicon.
図1に示す厚み測定装置50は、一例において測定部(図示せず)と算出部(図示せず)を備える。測定部は、エッチング後のウェハWの厚みを複数点で測定するセンサを備える。算出部は、測定部による測定結果(ウェハWの厚み)からウェハWの厚み分布を取得し、更にウェハWの平坦度(TTV:Total Thickness Variation)を算出する。なお、かかるウェハWの厚み分布及び平坦度の算出は、当該算出部に代えて、後述の制御装置130で行われてもよい。換言すれば、後述の制御装置130内に算出部(図示せず)が設けられてもよい。なお、厚み測定装置50の構成はこれに限定されず、任意に構成できる。
The
反転装置51は、ウェハWの第1の表面Waと第2の表面Wbを上下方向に反転させる。反転装置51の構成は任意である。 The inversion device 51 inverts the first surface Wa and the second surface Wb of the wafer W in the vertical direction. The inversion device 51 may be configured in any manner.
ウェハ搬送装置60は、トランジション装置30のX軸負方向側に配置されている。ウェハ搬送装置60は、ウェハWを保持して搬送する、例えば2つの搬送アーム61を有している。各搬送アーム61は、水平方向、鉛直方向、水平軸回り及び鉛直軸回りに移動自在に構成されている。そしてウェハ搬送装置60は、トランジション装置30、エッチング装置40、厚み測定装置50、反転装置51、後述の洗浄装置70、後述の厚み測定装置71、後述のバッファ装置72及び後述の反転装置73に対して、ウェハWを搬送可能に構成されている。
The
第2の処理ブロックG2には、洗浄装置70、厚み測定装置71、バッファ装置72、反転装置73及びウェハ搬送装置80が設けられている。洗浄装置70、厚み測定装置71、バッファ装置72及び反転装置73は、積層して配置されている。なお、洗浄装置70、厚み測定装置71、バッファ装置72及び反転装置73の数や配置はこれに限定されない。
The second processing block G2 is provided with a
洗浄装置70は、後述の研削装置90における研削後の少なくとも第1の表面Wa又は第2の表面Wbを洗浄する。
The
厚み測定装置71は、一例において上述の厚み測定装置50と同様の構成を有している。なお、厚み測定装置71の構成もこれに限定されず、任意に構成できる。
In one example, the thickness measuring device 71 has a configuration similar to that of the
バッファ装置72は、第1の処理ブロックG1から第2の処理ブロックG2に受け渡される処理前のウェハWを一時的に保持する。バッファ装置72の構成は任意である。なお、バッファ装置72は、後述するチャック93a、93bに対するウェハWの中心位置、及び/又はウェハWの水平方向の向きを調整するアライメント機構(図示せず)を有していてもよい。
The buffer device 72 temporarily holds the unprocessed wafer W that is transferred from the first processing block G1 to the second processing block G2. The configuration of the buffer device 72 is arbitrary. The buffer device 72 may also have an alignment mechanism (not shown) that adjusts the center position of the wafer W relative to the
反転装置73は、ウェハWの第1の表面Waと第2の表面Wbを上下方向に反転させる。反転装置73の構成は任意である。 The inversion device 73 inverts the first surface Wa and the second surface Wb of the wafer W in the vertical direction. The configuration of the inversion device 73 is arbitrary.
ウェハ搬送装置80は、例えば洗浄装置70、厚み測定装置71、バッファ装置72及び反転装置73のY軸正方向側に配置されている。ウェハ搬送装置80は、ウェハWを吸着保持面(図示せず)により吸着保持して搬送する、例えば2つの搬送アーム81を有している。各搬送アーム81は、多関節のアーム部材82に支持され、水平方向、鉛直方向、水平軸回り及び鉛直軸回りに移動自在に構成されている。そしてウェハ搬送装置80は、エッチング装置40、厚み測定装置50、反転装置51、洗浄装置70、厚み測定装置71、バッファ装置72、反転装置73及び後述の研削装置90に対して、ウェハWを搬送可能に構成されている。
The
第3の処理ブロックG3には、研削装置90が設けられている。研削装置90は、ウェハWの第1の表面Wa又は第2の表面Wbを研削して平坦化する。
The third processing block G3 is provided with a grinding
研削装置90は、回転テーブル91を有している。回転テーブル91は、回転機構(図示せず)によって、鉛直な回転中心線92を中心に回転自在に構成されている。回転テーブル91上には、ウェハWを吸着保持するチャック93a、93bが4つ設けられている。4つのチャック93a、93bのうち、2つの第1のチャック93aは、後述する第1の加工位置B1で研削に用いられるチャックである。これら2つの第1のチャック93aは、回転中心線92を挟んで点対称の位置に配置されている。残りの2つの第2のチャック93bは、後述する第2の加工位置B2で研削に用いられるチャックである。これら2つの第2のチャック93bも、回転中心線92を挟んで点対称の位置に配置されている。すなわち、第1のチャック93aと第2のチャック93bは、周方向に交互に配置されている。
The grinding
4つのチャック93a、93bは、回転テーブル91が回転することにより、受渡位置A1~A2及び加工位置B1~B2に移動可能になっている。また、4つのチャック93a、93bはそれぞれ、回転機構(図示せず)によって鉛直軸回りに回転可能に構成されている。
The four
第1の受渡位置A1は回転テーブル91の回転中心線92に対してX軸正方向側且つY軸正方向側の位置であり、第1の表面Waを研削する際に第1のチャック93aに対するウェハWの受け渡しが行われる。第2の受渡位置A2は回転テーブル91の回転中心線92に対してX軸正方向側且つY軸負方向側の位置であり、第2の表面Wbを研削する際に第2のチャック93bに対するウェハWの受け渡しが行われる。
The first transfer position A1 is a position on the positive X-axis side and the positive Y-axis side of the
第1の加工位置B1は回転テーブル91の回転中心線92に対してX軸負方向側且つY軸負方向側の位置であり、第1の研削ユニット100が配置される。第1の研削ユニット100は、環状形状で回転自在な研削砥石(図示せず)を備えた研削部101を有している。また研削部101は、支柱102に沿って鉛直方向に移動可能に構成されている。第1の研削ユニット100は、一例として、第1のチャック93aに保持されたウェハWの第1の表面Wa又は第2の表面Wbを研削する。
The first processing position B1 is a position on the negative X-axis and negative Y-axis side of the
第2の加工位置B2は回転テーブル91の回転中心線92に対してX軸負方向側且つY軸正方向側の位置であり、第2の研削ユニット110が配置される。第2の研削ユニット110は、環状形状で回転自在な研削砥石(図示せず)を備えた研削部111を有している。また研削部111は、支柱112に沿って鉛直方向に移動可能に構成されている。第2の研削ユニット110は、一例として、第2のチャック93bに保持されたウェハWの第2の表面Wb又は第1の表面Waを研削する。
The second processing position B2 is a position on the negative X-axis side and the positive Y-axis side of the
なお、受渡位置A1、A2又は加工位置B1、B2には、研削後のウェハWの厚みを測定する厚み測定装置(図示せず)が設けられていてもよい。 In addition, a thickness measuring device (not shown) for measuring the thickness of the wafer W after grinding may be provided at the transfer positions A1, A2 or the processing positions B1, B2.
以上のウェハ処理システム1には、表示パネル120が設けられる。表示パネル120は、例えばモニターやタッチパネルであり、ウェハ処理システム1に直接取り付けられてもよいし、又は遠隔で確認できるものであってもよい。表示パネル120には、ウェハ処理システム1で行われる各処理の操作を行うための画面が表示される。表示パネル120での操作結果の信号は、後述する制御装置130に出力される。
The above-described
以上のウェハ処理システム1には、少なくとも1つの制御装置130が設けられている。制御装置130は、本開示において述べられる種々の工程をウェハ処理システム1に実行させるコンピュータ実行可能な命令を処理する。制御装置130は、ここで述べられる種々の工程を実行するようにウェハ処理システム1の各要素を制御するように構成され得る。一実施形態において、制御装置130の一部又は全てがウェハ処理システム1に含まれてもよい。制御装置130は、処理部、記憶部及び通信インターフェースを含んでもよい。制御装置130は、例えばコンピュータにより実現される。処理部は、記憶部から種々の制御動作を行うことを可能にするロジック又はルーチンを提供するプログラムを読み出し、読み出されたプログラムを実行することにより種々の制御動作を行うように構成され得る。このプログラムは、予め記憶部に格納されていてもよく、必要なときに、媒体を介して取得されてもよい。取得されたプログラムは、記憶部に格納され、処理部によって記憶部から読み出されて実行される。媒体は、コンピュータに読み取り可能な種々の記憶媒体であってもよく、通信インターフェースに接続されている通信回線であってもよい。記憶媒体は、一時的なものであっても非一時的なものであってもよい。処理部は、CPU(Central Processing Unit)であってもよく、1つ又は複数の回路であってもよい。記憶部は、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はこれらの組み合わせを含んでもよい。通信インターフェースは、LAN(Local Area Network)等の通信回線を介してウェハ処理システム1との間で通信してもよい。
The above
次に、以上のように構成されたウェハ処理システム1を用いて行われるウェハ処理について説明する。本実施形態では、インゴットからワイヤーソー等により切り出されたウェハW、又はラッピングされたウェハWに対し、厚みの面内均一性を向上させるための処理を行う。
Next, we will explain the wafer processing performed using the
先ず、複数のウェハWを収納したカセットCが、搬入出ステーション2のカセット載置台10に載置される。カセットCにおいてウェハWは、第1の表面Waが上側、第2の表面Wbが下側を向いた状態で収納されている。次に、ウェハ搬送装置20によりカセットC内のウェハWが取り出され、トランジション装置30に搬送される。トランジション装置30に搬送されたウェハWは、ウェハ搬送装置60によりバッファ装置72に搬送される。
First, a cassette C containing multiple wafers W is placed on the cassette placement table 10 of the loading/
次に、ウェハWはウェハ搬送装置80により研削装置90に搬送され、第1の受渡位置A1の第1のチャック93aに受け渡される。第1のチャック93aでは、ウェハWの第2の表面Wbが吸着保持される。
Then, the wafer W is transported by the
次に、回転テーブル91を回転させて、ウェハWを第1の加工位置B1に移動させる。そして、第1の研削ユニット100によって、第1の表面Waが研削される(図4のSt1)。 Next, the rotary table 91 is rotated to move the wafer W to the first processing position B1. Then, the first surface Wa is ground by the first grinding unit 100 (St1 in FIG. 4).
次に、回転テーブル91を回転させて、ウェハWを第1の受渡位置A1に移動させる。 Next, the rotary table 91 is rotated to move the wafer W to the first transfer position A1.
次に、ウェハWはウェハ搬送装置80により洗浄装置70に搬送される。洗浄装置70では、ウェハWの第1の表面Waが洗浄される(図4のSt2)。St2では、ウェハWの第2の表面Wbも洗浄されてもよい。
The wafer W is then transported by the
次に、ウェハWはウェハ搬送装置80により反転装置73に搬送される。反転装置73では、ウェハWの第1の表面Waと第2の表面Wbを上下方向に反転させる(図4のSt3)。すなわち、第1の表面Waが下側、第2の表面Wbが上側を向いた状態にウェハWが反転される。
Then, the wafer W is transported to the inversion device 73 by the
次に、ウェハWはウェハ搬送装置80により研削装置90に搬送され、第2の受渡位置A2の第2のチャック93bに受け渡される。第2のチャック93bでは、ウェハWの第1の表面Waが吸着保持される。
Then, the wafer W is transported by the
次に、回転テーブル91を回転させて、ウェハWを第2の加工位置B2に移動させる。そして、第2の研削ユニット110によって、ウェハWの第2の表面Wbが研削される(図4のSt4)。 Next, the rotary table 91 is rotated to move the wafer W to the second processing position B2. Then, the second surface Wb of the wafer W is ground by the second grinding unit 110 (St4 in FIG. 4).
次に、回転テーブル91を回転させて、ウェハWを第2の受渡位置A2に移動させる。 Next, the rotary table 91 is rotated to move the wafer W to the second transfer position A2.
次に、ウェハWはウェハ搬送装置80により厚み測定装置71に搬送される。厚み測定装置71では、第1の表面Waと第2の表面Wbの両面を研削後のウェハWの厚みを複数点で測定することでウェハWの厚み分布を取得する(図4のSt5)。厚み測定装置71では、更にウェハWの平坦度を算出してもよい。取得されたウェハWの厚み分布は例えば制御装置130に出力され、一例として、次にウェハ処理システム1で処理される他のウェハWの処理に用いられる。なお、研削装置90に厚み測定装置が設けられている場合、研削後のウェハWの厚みは、当該研削装置90の厚み測定装置で測定してもよい。
Next, the wafer W is transported by the
次に、ウェハWはウェハ搬送装置80により洗浄装置70に搬送される。洗浄装置70では、ウェハWの第2の表面Wbが洗浄される(図4のSt6)。St6では、ウェハWの第1の表面Waも洗浄されてもよい。
Then, the wafer W is transported by the
次に、ウェハWはウェハ搬送装置60によりエッチング装置40に搬送される。エッチング装置40では、予め定められた既定のエッチング条件で、ウェハWの第2の表面Wbがエッチング液Eによりエッチングされる(図4のSt7)。St7では、既定のエッチング条件で第2の表面Wbをエッチングすることにより、第2の表面Wbを目標形状に加工する。
The wafer W is then transported by the
次に、ウェハWはウェハ搬送装置60により反転装置51に搬送される。反転装置51では、ウェハWの第1の表面Waと第2の表面Wbを上下方向に反転させる(図4のSt8)。すなわち、第1の表面Waが上側、第2の表面Wbが下側を向いた状態にウェハWが反転される。
Then, the wafer W is transported to the inversion device 51 by the
次に、ウェハWはウェハ搬送装置60により厚み測定装置50に搬送される。厚み測定装置50では、第2の表面Wbをエッチング後のウェハWの厚みを複数点で測定することでウェハWの厚み分布を取得し、更にウェハWの平坦度を算出する(図4のSt9)。算出されたウェハWの厚み分布及び平坦度は例えば制御装置130に出力される。
Then, the wafer W is transported by the
制御装置130では、St9で算出されて制御装置130に出力されたウェハWの厚み分布及び平坦度から、最適化処理を行い、第1の表面Waのエッチング処理におけるエッチング量分布(エッチングプロファイル)を最適化する、当該第1の表面Waの最適エッチング条件を決定する(図4のSt10)。なお、エッチング量は、エッチングによってウェハWが除去される量であり、エッチング量分布は、ウェハWの径方向(ウェハ面内)のエッチング量の分布である。制御装置130における第1の表面Waの最適エッチング条件の決定方法については後述する。
The
次に、ウェハWはウェハ搬送装置60によりエッチング装置40に搬送される。エッチング装置40では、St10で決定された最適エッチング条件で、ウェハWの第1の表面Waがエッチング液Eによりエッチングされる(図4のSt11)。St11では、最適エッチング条件で第1の表面Waをエッチングすることにより、エッチング量分布を最適化し、第1の表面Waを目標形状に加工する。
The wafer W is then transported by the
次に、ウェハWはウェハ搬送装置60により厚み測定装置50に搬送される。厚み測定装置50では、第1の表面Waと第2の表面Wbの両面をエッチング後のウェハWの厚みを複数点で測定することでウェハWの厚み分布を取得する(図4のSt12)。厚み測定装置50では、更にウェハWの平坦度を算出してもよい。取得されたウェハWの厚み分布は例えば制御装置130に出力され、一例として、次にウェハ処理システム1で処理される他のウェハWの処理に用いられる。
Then, the wafer W is transported by the
その後、全ての処理が施されたウェハWは、トランジション装置30を介してカセット載置台10のカセットCに搬送される。こうして、ウェハ処理システム1における一連のウェハ処理が終了する。
Then, the wafer W that has been subjected to all the processes is transferred to the cassette C on the cassette mounting table 10 via the
なお、以上の実施形態では、St1で第1の表面Waを研削した後、St4で第2の表面Wbを研削したが、これらの表面の研削の順序は逆であってもよい。また、St7で第2の表面Wbをエッチングした後、St11で第1の表面Waをエッチングしたが、これらの表面のエッチングの順序は逆であってもよい。 In the above embodiment, the first surface Wa is ground in St1, and then the second surface Wb is ground in St4, but the order of grinding these surfaces may be reversed. Also, the second surface Wb is etched in St7, and then the first surface Wa is etched in St11, but the order of etching these surfaces may be reversed.
また、以上の実施形態では、St11における第1の表面Waのエッチングは、St10で決定された最適エッチング条件で行われたが、これに代えて、予め定められた既定のエッチング条件で行ってもよい。かかる場合、本実施形態のSt9、St10は省略される。また、St7における第2の表面Wbのエッチングは、予め定められた既定のエッチング条件で行われたが、これに代えて、最適エッチング条件で行ってもよい。最適エッチング条件は、St10と同様に決定される。 In the above embodiment, the etching of the first surface Wa in St11 is performed under the optimal etching conditions determined in St10, but instead, it may be performed under predetermined default etching conditions. In such a case, St9 and St10 in this embodiment are omitted. In addition, the etching of the second surface Wb in St7 is performed under predetermined default etching conditions, but instead, it may be performed under optimal etching conditions. The optimal etching conditions are determined in the same way as in St10.
次に、上述した最適エッチング条件の決定方法(図4のSt10)について説明する。 Next, we will explain the method for determining the optimal etching conditions mentioned above (Step 10 in Figure 4).
先ず、ウェハ処理システム1におけるウェハWに対する処理を行う前に、学習処理を行い、複数の学習データを取得する(図5のSt100)。なお、学習データは、あるエッチング条件に対するウェハWのエッチング量分布である。
First, before processing the wafer W in the
St100では、例えば複数の異なるエッチング条件でダミーウェハに対してエッチングを行う。具体的には、例えばエッチング時のダミーウェハの回転速度R(回転数ともいう。)、ノズル43のスキャン速度V(スイング速度ともいう。)、ノズル43のスキャン幅L(図3のスキャン幅Lを参照、スイング半径ともいう。)、又は、ノズル43のループ回数N等を変更して、ダミーウェハのエッチングを行う。この際、各ダミーウェハに対するエッチングの処理時間は同じである。ダミーウェハのエッチングは、St11におけるエッチングと同様に、ダミーウェハを回転させるともに、ノズル43を往復移動させながら、ノズル43からダミーウェハにエッチング液Eを供給して行う。以下の説明では、ダミーウェハの両端部間におけるノズル43の往復移動を1ループとする。
In St100, etching is performed on the dummy wafer under, for example, a plurality of different etching conditions. Specifically, the dummy wafer is etched by changing, for example, the rotation speed R (also called the number of rotations) of the dummy wafer during etching, the scan speed V (also called the swing speed) of the
各エッチング条件でのダミーウェハのエッチングは、予め決められた所望の時間(所望のループ回数)で実施される。そして、ダミーウェハのエッチング量分布が取得され、当該エッチング量分布は制御装置130に出力される。更に制御装置130では、出力された各エッチング条件でのエッチング量分布を単位時間(単位ループ回数)でのエッチング量分布に圧縮し、当該圧縮された各々のエッチング量分布を、上記学習データとして記憶する。
The etching of the dummy wafer under each etching condition is carried out for a predetermined desired time (desired number of loops). Then, the etching amount distribution of the dummy wafer is acquired, and this etching amount distribution is output to the
St100において学習データを取得する際、図6に示すように表示パネル120において、学習データ取得画面200が表示される。学習データ取得画面200には、学習データを取得する際のエッチング条件の一覧表201が表示される。エッチング条件の一覧表201には、例えば学習データのID、回転速度R、スキャン速度V、スキャン幅L、ループ回数N等が表示される。
When learning data is acquired in St100, a learning
また、学習データ取得画面200には、学習データを追加するための追加ボタン202が表示される。ユーザが追加ボタン202を押すと、表示パネル120にエッチング条件入力画面(図示せず)が表示される。エッチング条件入力画面には、例えば回転速度R、スキャン速度V、スキャン幅L、ループ回数Nのそれぞれの条件について、予め設定された数値が複数表示され、ユーザが各条件の数値を選択できるようになっている。或いは、エッチング条件入力画面は、例えば回転速度R、スキャン速度V、スキャン幅L、ループ回数Nを、ユーザが直接入力できるようになっていてもよい。エッチング条件入力画面に入力されたエッチング条件は、学習データ取得画面200のエッチング条件の一覧表201に表示される。
The learning
また、学習データ取得画面200には、学習データを削除するための削除ボタン203が表示される。ユーザが削除ボタン203を押すと、例えば削除対象の学習データ削除画面(図示せず)が表示される。学習データ削除画面には、例えば学習データIDが複数表示され、ユーザが削除対象の学習データIDを選択できるようになっている。そしてユーザが学習データIDを選択すると、学習データ取得画面200のエッチング条件の一覧表201から当該学習データIDのエッチング条件が削除される。
The learning
なお、図6に示す学習データ取得画面200は一例であって、他の項目が表示されていてもよい。
Note that the learning
なお、上記においてはダミーウェハのエッチングにより上記学習データを取得する場合を例に説明を行ったが、学習データを取得する際のエッチング対象はダミーウェハには限定されない。具体的には、例えばウェハ処理システム1で処理される製品用のウェハWのエッチング処理結果を、上記学習データとして記憶するようにしてもよい。また、例えばウェハWの第1の表面Waに膜が形成されている場合には、エッチング対象を膜として、当該膜のエッチング処理結果を、上記学習データとして記憶するようにしてもよい。
In the above, an example was described in which the learning data was obtained by etching a dummy wafer, but the etching target when obtaining the learning data is not limited to a dummy wafer. Specifically, for example, the etching process result of a product wafer W processed by the
また、上記学習データの取得は、ウェハ処理システム1において行われたが、ウェハ処理システム1の外部で行われてもよい。かかる場合、制御装置130は、ウェハ処理システム1の外部で取得された複数の学習データに基づいて、最適エッチング条件を決定する。
In addition, although the learning data was acquired in the
次に、St100で取得された複数の学習データ(エッチング量分布)に対してスクリーニング処理を行い、後述するSt111に不要なエッチング量分布と、類似するエッチング量分布との少なくともいずれかを除去して、複数の有効学習データを選定する(図5のSt101)。以下の説明において、有効学習データのエッチング量分布を「有効エッチング量分布」という場合がある。なお、St101における複数の学習データのスクリーニング方法は後述する。 Next, a screening process is performed on the multiple learning data (etching amount distributions) acquired in St100, and at least one of unnecessary etching amount distributions and similar etching amount distributions is removed in St111 described below, to select multiple valid learning data (St101 in FIG. 5). In the following description, the etching amount distribution of the valid learning data may be referred to as the "valid etching amount distribution." The method of screening multiple learning data in St101 will be described later.
次に、エッチング後のウェハWの目標形状における厚み分布と、St9で取得されたエッチング後のウェハWの表面形状(以下、「実測形状」という。)における厚み分布とに基づいて、St11のエッチング処理における目標エッチング量分布を取得する(図5のSt110)。エッチング処理の目標エッチング量分布は、一例としてウェハWの目標形状の厚み分布と実測形状の厚み分布との差分を算出することで取得できる。 Next, based on the thickness distribution in the target shape of the wafer W after etching and the thickness distribution in the surface shape of the wafer W after etching obtained in St9 (hereinafter referred to as the "actual shape"), the target etching amount distribution in the etching process in St11 is obtained (St110 in Figure 5). The target etching amount distribution in the etching process can be obtained, as an example, by calculating the difference between the thickness distribution in the target shape of the wafer W and the thickness distribution in the actual shape.
次に、最適化手法(最適化計算)を用いて、複数の有効学習データ(有効エッチング量分布)を重ね合わせて、St110で取得された目標エッチング量分布になるように、重ね合わせに用いる有効学習データと、当該有効学習データの重ね合わせ回数を最適化する(図5のSt111)。 Next, an optimization method (optimization calculation) is used to optimize the effective learning data used in the overlapping and the number of overlapping times of the effective learning data so as to overlap multiple pieces of effective learning data (effective etching amount distribution) to achieve the target etching amount distribution obtained in St110 (St111 in FIG. 5).
St111では、例えば有効エッチング量分布の制御をナップサック問題に当てはめて、有効学習データと有効学習データの重ね合わせ回数を最適化する。例えば、エッチング量分布がナップサック問題のナップサックであって、有効学習データがナップサック問題のアイテムである。そして、重ね合わせた有効エッチング量分布と、St110の目標エッチング量分布との差分が最小になるように、有効学習データと有効学習データの重ね合わせ回数を最適化する。換言すれば、St11における第1の表面Waのエッチング時のエッチング量分布が最適化される。 In St111, for example, the control of the effective etching amount distribution is applied to a knapsack problem to optimize the number of times that the effective learning data and the effective learning data are overlapped. For example, the etching amount distribution is the knapsack of the knapsack problem, and the effective learning data is the items of the knapsack problem. Then, the number of times that the effective learning data and the effective learning data are overlapped is optimized so that the difference between the overlapped effective etching amount distribution and the target etching amount distribution of St110 is minimized. In other words, the etching amount distribution during etching of the first surface Wa in St11 is optimized.
次に、St111で最適化された有効学習データに対応するエッチング条件を統合して、最適エッチング条件を決定する(図5のSt112)。具体的には、選択された複数のエッチング条件を、最適化された重ね合わせ回数で行うように、複数のエッチング条件を統合して、最適エッチング条件が決定される。換言すれば、エッチング量分布を最適化する最適エッチング条件が決定される。 Next, the etching conditions corresponding to the effective learning data optimized in St111 are integrated to determine the optimal etching conditions (St112 in FIG. 5). Specifically, the optimal etching conditions are determined by integrating the multiple selected etching conditions so that the multiple etching conditions are performed with an optimized number of overlaps. In other words, the optimal etching conditions that optimize the etching amount distribution are determined.
以上のようにSt10における第1の表面Waの最適エッチング条件が決定される。かかる場合、St11でウェハWの第1の表面Waを最適エッチング条件でエッチングすることにより、エッチング量分布を最適化し、第1の表面Waを目標形状に加工することができる。 As described above, the optimal etching conditions for the first surface Wa in St10 are determined. In this case, by etching the first surface Wa of the wafer W under the optimal etching conditions in St11, the etching amount distribution can be optimized and the first surface Wa can be processed into the target shape.
なお、St10で決定された第1の表面Waの最適エッチング条件は、制御装置130に記憶され、当該制御装置130にエッチング条件の履歴が残る。この際、最適エッチング条件の決定に使用された学習データも記憶される。また、第1の表面Waの最適エッチング条件は、表示パネル120のエッチング条件履歴画面(図示せず)に表示されるようにしてもよい。
The optimal etching conditions for the first surface Wa determined in St10 are stored in the
なお、上述したようにSt11における第1の表面Waのエッチングは、最適エッチング条件ではなく、予め定められた既定のエッチング条件で行われる場合がある。このため、エッチング条件を設定するに際し、ユーザが学習データを使用するか否かを選択できるようにしてもよい。 As mentioned above, the etching of the first surface Wa in St11 may be performed under predetermined etching conditions rather than the optimal etching conditions. For this reason, when setting the etching conditions, the user may be allowed to select whether or not to use the learning data.
かかる場合、例えば図7に示すように表示パネル120には、学習データ選択画面210が表示される。学習データ選択画面210には、学習ボタン211と補正有無ボタン212が表示される。ユーザが学習ボタン211を押すと、第1の表面Waのエッチングに際して学習データを使用することが選択される。またユーザが補正有無ボタン212を押すと、第1の表面Waのエッチングに際してエッチング条件を補正して最適エッチング条件が決定される。そして、第1の表面Waのエッチングを、最適エッチング条件で行うか、又は既定のエッチング条件で行うかが決定される。なお、図7に示す学習データ選択画面210は一例であって、他の項目が表示されていてもよい。
In such a case, for example, as shown in FIG. 7, a learning
次に、上述した複数の学習データのスクリーニング方法(図5のSt101)について説明する。複数の学習データのスクリーニング方法としては、例えば3つのパターンがある。第1のパターンは幾何学手法を用いた方法であり、第2のパターンはグラフ手法を用いた方法であり、第3のパターンはQR分解手法を用いた方法である。
Next, the above-mentioned method for screening multiple pieces of training data (
第1のパターンでは、幾何学手法を用いて、複数の学習データをスクリーニングする。先ず、St100の学習処理におけるエッチング条件毎に、学習データのエッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得する。本実施形態では、エッチング量分布ベクトルとして、エッチング量分布行列Aを取得する(図8のSt200)。エッチング量分布行列Aは、エッチング量分布における測定点数をn点とし、St100の学習処理におけるエッチング条件数をm個とした場合の、エッチング量分布を(n,m)とした行列である。 In the first pattern, a geometric method is used to screen multiple pieces of learning data. First, for each etching condition in the learning process of St100, an etching amount distribution vector is obtained whose components are the etching amounts of multiple measurement points in the etching amount distribution of the learning data. In this embodiment, an etching amount distribution matrix A is obtained as the etching amount distribution vector (St200 in FIG. 8). The etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m.
次に、St200で取得したエッチング量分布行列Aの次元を圧縮する(図8のSt201)。St201では、エッチング量分布行列Aの次元をnからrに圧縮し、(r,m)の行列Arにする。次元圧縮の方法は任意であるが、例えば特異値分解(SVD)や主成分分析(PCA)等の低ランク近似が用いられる。また、r次元は、任意に設定することができる。 Next, the dimension of the etching amount distribution matrix A acquired in St200 is compressed (St201 in FIG. 8). In St201, the dimension of the etching amount distribution matrix A is compressed from n to r to obtain a matrix A r of (r, m). Any method for dimensional compression may be used, and for example, low-rank approximation such as singular value decomposition (SVD) or principal component analysis (PCA) may be used. The r dimension may be set arbitrarily.
次に、St201で次元圧縮されたエッチング量分布行列Arに基づいて、凸包の頂点を取得する(図8のSt202)。凸包は、エッチング量分布行列Arの点のすべてを包含する最小の凸多角形(凸多面体)である。St202では、凸包アルゴリズムを用いて、エッチング量分布行列Ar{a0,a1,・・・,am}が張る立体(多角形)、すなわちr次元ポリトープ(超多面体)の凸包の焦点集合を取得する。なお、凸包アルゴリズムは任意であり、公知のアルゴリズムが用いられる。 Next, the vertices of the convex hull are obtained based on the etching amount distribution matrix A r dimensionally compressed in St201 (St202 in FIG. 8). The convex hull is the smallest convex polygon (convex polyhedron) that includes all the points of the etching amount distribution matrix A r . In St202, a convex hull algorithm is used to obtain a focal set of the convex hull of a solid (polygon) spanned by the etching amount distribution matrix A r {a 0 , a 1 , ..., a m }, that is, an r-dimensional polytope (hyperpolyhedron). Note that the convex hull algorithm is arbitrary, and a known algorithm is used.
図9は、St202で取得される凸包の一例を示す。図9では、測定点数nが6であるエッチング量分布ベクトル{a0,a1,a2,a3,a4,a5}を2次元に圧縮した際の凸包を模式的に示す。
Fig. 9 shows an example of the convex hull acquired in
次に、凸包の内部に存在するエッチング量分布を除去して、複数の有効エッチング量分布(複数の有効学習データ)を選定する(図8のSt203)。St10において最適化されたエッチング量分布は学習データ(エッチング量分布)の一時結合になるため、St10の最適化処理における実行可能解は、凸包の内部に存在する。なお、実行可能解は、設計変数や目的関数値が制約条件を満たす、探索空間上の実行可能領域にある解である。かかる場合、St10のエッチング量分布の最適化性能に影響しないエッチング量分布(学習データ)、すなわち最適化処理に不要なデータを除去することができる。 Next, the etching amount distributions present inside the convex hull are removed, and multiple effective etching amount distributions (multiple effective learning data) are selected (St203 in Figure 8). Since the etching amount distribution optimized in St10 is a temporary combination of the learning data (etching amount distributions), a feasible solution in the optimization process of St10 exists inside the convex hull. Note that a feasible solution is a solution in a feasible region in the search space where the design variables and objective function values satisfy the constraint conditions. In this case, it is possible to remove etching amount distributions (learning data) that do not affect the optimization performance of the etching amount distribution in St10, i.e., data that is unnecessary for the optimization process.
図9に示した例においては、凸包は6つのエッチング量分布ベクトルが張る多角形であり、凸包の内部にあるエッチング量分布ベクトルa5が除去される。エッチング量分布ベクトルa5は、例えばエッチング量分布ベクトルa0、a1の一次結合(組み合わせ)で表現できるため、除去される。 9, the convex hull is a polygon spanned by six etching amount distribution vectors, and the etching amount distribution vector a5 inside the convex hull is removed. The etching amount distribution vector a5 can be expressed as a linear combination of the etching amount distribution vectors a0 and a1 , for example, and is therefore removed.
以上のようにSt200~St203が行われて、St10のエッチング量分布の最適化処理に不要なエッチング量分布が除去され、複数の有効学習データが選定される。 St200 to St203 are performed as described above, and etching amount distributions that are not necessary for the optimization process of etching amount distribution in St10 are removed, and multiple valid learning data are selected.
図10は、第1のパターンの幾何学手法を用いて、複数の学習データをスクリーニングする様子を示す説明図である。図10(a)はスクリーニング前の複数の学習データを示し、図10(b)、(c)はスクリーニング後の複数の有効学習データを示す。また、図10(b)ではエッチング量分布行列の次元を4次元に圧縮し(r=4)、図10(c)ではエッチング量分布行列の次元を3次元に圧縮した(r=3)。なお、図10の横軸は、ウェハの中心部(横軸の0(ゼロ))から外周部までの径方向位置を示し、縦軸はエッチング量を示す。また、本例において、ウェハWは例えば300mm径のウェハであるが、これに限定されるものではない。また本例において、エッチング量の数値は例示であり、これに限定されるものではない。 10 is an explanatory diagram showing how multiple learning data are screened using the geometric method of the first pattern. FIG. 10(a) shows multiple learning data before screening, and FIGS. 10(b) and (c) show multiple valid learning data after screening. In addition, in FIG. 10(b), the dimension of the etching amount distribution matrix is compressed to four dimensions (r=4), and in FIG. 10(c), the dimension of the etching amount distribution matrix is compressed to three dimensions (r=3). Note that the horizontal axis of FIG. 10 indicates the radial position from the center of the wafer (0 (zero) on the horizontal axis) to the outer periphery, and the vertical axis indicates the etching amount. In this example, the wafer W is, for example, a wafer with a diameter of 300 mm, but is not limited to this. In this example, the numerical values of the etching amount are examples and are not limited to this.
図10を参照すると、図10(a)に示した学習データの数が27個であったのに対し、図10(b)に示した有効学習データの数は23個であり、図10(c)に示した有効学習データの数は20個であった。したがって、第1のパターンの幾何学手法を用いた場合、有効学習データを適切に選定することができる。また、エッチング量分布行列で圧縮する次元rを小さくするほど、有効学習データの数が少なくなり、当該有効学習データをより適切に選定できる。 Referring to FIG. 10, the number of learning data shown in FIG. 10(a) is 27, while the number of valid learning data shown in FIG. 10(b) is 23, and the number of valid learning data shown in FIG. 10(c) is 20. Therefore, when the first pattern of geometric method is used, valid learning data can be appropriately selected. Furthermore, the smaller the dimension r compressed in the etching amount distribution matrix, the smaller the number of valid learning data, and the more appropriately the valid learning data can be selected.
ここで、従来のように、St100で取得された学習データをすべて用いた場合、St10のエッチング量分布の最適化処理において、St111で最適化計算を行う際の計算時間が長くなる。すなわち、学習データの数が多いほど、最適化計算の計算時間が長くなる。 Here, if all of the learning data acquired in St100 is used as in the conventional method, the calculation time required for the optimization calculation in St111 in the optimization process of the etching amount distribution in St10 will be long. In other words, the more learning data there is, the longer the calculation time required for the optimization calculation.
最適化計算の計算時間が長くなると、ウェハ処理のスループットが低下する場合がある。例えば、ウェハWの搬送経路によっては、St111の最適化計算が行われる間、St9において厚み測定装置50で次のウェハWの厚み測定ができない場合がある。かかる場合、次のウェハWの待機時間が長くなり、ウェハ処理のスループットが低下してしまう。
If the optimization calculation takes a long time, the throughput of wafer processing may decrease. For example, depending on the transport path of the wafer W, the
また、最適化計算で用いられる学習データの数が多くなると、当該最適化計算が終わらない場合がある。最適化計算としてナップサック問題を解く場合、学習データの数が多いと、いわゆる組み合わせ爆発という現象が生じ、解が求まらない場合がある。 In addition, if the amount of training data used in an optimization calculation becomes large, the optimization calculation may not finish. When solving a knapsack problem as an optimization calculation, if the amount of training data is large, a phenomenon known as combinatorial explosion may occur, and a solution may not be found.
また、最適化計算を行う際には、適切な解を得るため、新たなエッチング条件の学習データを追加する場合がある。しかしながら、かかる場合、最適化計算の計算時間が更に長くなるため、実質的に学習データを追加することができない。 In addition, when performing optimization calculations, learning data for new etching conditions may be added to obtain an appropriate solution. However, in such cases, the calculation time for the optimization calculation becomes even longer, making it practically impossible to add learning data.
この点、第1のパターンの幾何学手法を用いた場合、学習データの数を適切に減らして有効学習データを取得することができ、その結果、最適化計算の計算時間を短縮することができる。したがって、上述したウェハ処理のスループットの低下を抑えて、当該スループットを向上させることができる。また、最適化計算を適切に行うことができ、更に新たなエッチング条件の学習データを追加することも可能になる。そして、新たなエッチング条件の学習データを追加した場合、St10のエッチング量分布の最適化処理の信頼性を向上させて、最適化精度(推定精度)を向上させることができる。 In this regard, when the geometric method of the first pattern is used, the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for the optimization calculation can be shortened. Therefore, the decrease in throughput of the wafer processing described above can be suppressed, and the throughput can be improved. In addition, the optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions. And, when learning data for new etching conditions is added, the reliability of the optimization process for the etching amount distribution of St10 can be improved, and the optimization accuracy (estimation accuracy) can be improved.
また、第1のパターンの幾何学手法を用いた場合、最適化計算の計算時間を短縮でき、このことを換言すれば、元のSt100で取得する学習データの数を増加させることも可能である。かかる場合も、St10のエッチング量分布の最適化処理の信頼性を向上させて、最適化精度を向上させることができる。 In addition, when the geometric method of the first pattern is used, the calculation time for the optimization calculation can be shortened, or in other words, it is possible to increase the amount of learning data acquired in the original St100. In such a case, it is possible to improve the reliability of the optimization process of the etching amount distribution of St10, and improve the optimization accuracy.
また、通常、St111の最適化計算で用いる学習データの数を減らすと、エッチング量分布の最適化処理における最適化精度は変わりやすくなる。この点、第1のパターンの幾何学手法を用いた場合、St203で除去した学習データは、他の学習データの組み合わせで代替できるため、St10のエッチング量分布の最適化処理における最適化精度を維持することができる。例えば、図9に示した例では、除去されるエッチング量分布ベクトルa5は、エッチング量分布ベクトルa0、a1の組み合わせで代替できる。 In addition, generally, when the number of learning data used in the optimization calculation in St111 is reduced, the optimization accuracy in the optimization process of the etching amount distribution is likely to change. In this regard, when the geometric method of the first pattern is used, the learning data removed in St203 can be replaced with a combination of other learning data, so that the optimization accuracy in the optimization process of the etching amount distribution in St10 can be maintained. For example, in the example shown in FIG. 9, the removed etching amount distribution vector a5 can be replaced with a combination of etching amount distribution vectors a0 and a1 .
なお、第1のパターンの幾何学手法において、St201のエッチング量分布行列の次元圧縮は必須ではなく、St201を省略してもよい。但し、St201の次元圧縮をしない場合、St202で取得された凸包の内部に含まれるエッチング量分布ベクトルが少なくなり、すなわち除去できる不要なエッチング量分布が少なくなる。このため、St201の次元圧縮を行うことが好ましく、かかる場合、最適化処理に不要なエッチング量分布を適切に除去して、有効学習データを適切に選定することができる。 In addition, in the geometric method of the first pattern, dimensional compression of the etching amount distribution matrix of St201 is not essential, and St201 may be omitted. However, if dimensional compression of St201 is not performed, fewer etching amount distribution vectors are contained inside the convex hull obtained in St202, that is, fewer unnecessary etching amount distributions can be removed. For this reason, it is preferable to perform dimensional compression of St201, and in such a case, etching amount distributions unnecessary for the optimization process can be appropriately removed, and effective learning data can be appropriately selected.
第2のパターンでは、グラフ手法を用いて、複数の学習データをスクリーニングする。先ず、エッチング量分布ベクトルとして、エッチング量分布行列Aを取得する(図11のSt300)。エッチング量分布行列Aは、エッチング量分布における測定点数をn点とし、St100の学習処理におけるエッチング条件数をm個とした場合の、エッチング量分布を(n,m)とした行列である。St300におけるエッチング量分布行列Aの取得方法は、St200と同様であるので詳細説明を省略する。 In the second pattern, a graph method is used to screen multiple pieces of learning data. First, an etching amount distribution matrix A is obtained as an etching amount distribution vector (St300 in FIG. 11). The etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m. The method of obtaining the etching amount distribution matrix A in St300 is the same as in St200, so a detailed explanation will be omitted.
次に、St300で取得したエッチング量分布行列Aの次元を圧縮し、r次元のエッチング量分布行列Arを取得する(図11のSt301)。St301における次元圧縮方法は、St201と同様であるので詳細説明を省略する。 Next, the dimension of the etching amount distribution matrix A acquired in St300 is compressed to acquire an r-dimensional etching amount distribution matrix A r (St301 in FIG. 11). The dimension compression method in St301 is the same as that in St201, and therefore a detailed description thereof will be omitted.
次に、St301で次元圧縮されたエッチング量分布行列Arの列間、すなわちエッチング量分布ベクトル間で類似度又は相違度を算出する(図11のSt302)。St302における類似度又は相違度の算出方法は任意であり、公知の方法が用いられる。 Next, the similarity or dissimilarity between columns of the etching amount distribution matrix A r that has been dimension-compressed in St301, i.e., between etching amount distribution vectors, is calculated (St302 in FIG. 11). The method for calculating the similarity or dissimilarity in St302 is arbitrary, and a known method is used.
以下では、St302において相違度を算出する場合について説明する。St302では、例えばエッチング量分布行列Arの列間で相違度||uk-ul||2を算出する。エッチング量分布ベクトル間の類似度が低いとき、或いは、個々のエッチング量分布ベクトルのL2ノルムが大きいときに、上記の外積のL2ノルムは大きな値をとるため、相違度と見なすことができる。 The following describes the case where the dissimilarity is calculated in St302. In St302, for example, the dissimilarity ∥u k -u l ∥ 2 is calculated between columns of the etching amount distribution matrix A r . When the similarity between the etching amount distribution vectors is low, or when the L 2 norm of each etching amount distribution vector is large, the L 2 norm of the cross product takes a large value, and can be regarded as a dissimilarity.
次に、エッチング条件を頂点(ノード)とし、相違度を辺(エッジ)の重みとした第1の完全グラフを取得する(図11のSt303)。第1の完全グラフは、相違なる2つの頂点がすべて隣接している単純グラフであって、すなわちすべての頂点を辺で連結した完全無向グラフである。図12(a)は、St303で取得される第1の完全グラフの一例を示す。なお、第1の完全グラフにおける頂点は、エッチング条件に代えて、エッチング量分布であってもよい。また、第1の完全グラフにおける辺は、相違度に代えて、類似度であってもよい。 Next, a first complete graph is obtained in which the etching conditions are the vertices (nodes) and the dissimilarity is the weight of the edge (St303 in FIG. 11). The first complete graph is a simple graph in which every two dissimilar vertices are adjacent, that is, a complete undirected graph in which all vertices are connected by edges. FIG. 12(a) shows an example of the first complete graph obtained in St303. Note that the vertices in the first complete graph may be etching amount distributions instead of etching conditions. Also, the edges in the first complete graph may be similarities instead of dissimilarity.
次に、St303で取得した第1の完全グラフにおいて、相違度がエッジカットパラメータs以下の重みの辺を除去して、第2の完全グラフを取得する(図11のSt304)。エッジカットパラメータsは、予め定められた閾値であって、任意に決定することができる。図12(b)は、St304で取得される第2の完全グラフの一例を示す。なお、第1の完全グラフの辺に類似度が用いられる場合、St304では、類似度が予め定められた閾値以上の重みの辺を除去して、第2の完全グラフを取得する。 Next, in the first complete graph obtained in St303, edges whose dissimilarity is equal to or less than the edge cut parameter s are removed to obtain a second complete graph (St304 in FIG. 11). The edge cut parameter s is a predetermined threshold and can be determined arbitrarily. FIG. 12(b) shows an example of the second complete graph obtained in St304. Note that, when similarity is used for the edges of the first complete graph, in St304, edges whose dissimilarity is equal to or more than the predetermined threshold are removed to obtain the second complete graph.
次に、St304で取得した第2の完全グラフにおいて、最大クリーク問題を解き、最大クリークの頂点集合を求め、当該頂点集合に含まれる頂点に対応するエッチング量分布を有効エッチング量分布(有効学習データ)と選定する(図11のSt305)。St305において、最大クリーク問題は、単純無向グラフ中で完全グラフを誘導する頂点集合のうち、頂点数が最大のものを見つける最適化問題の一種であって、この最大クリーク問題を解くことで、最大クリークの頂点集合が求められる。また、第2の完全グラフの頂点はエッチング条件であるが、頂点集合に含まれるエッチング条件に対応するエッチング量分布を有効エッチング量分布とする。なお、第2の完全グラフの頂点がエッチング量分布である場合には、頂点集合に含まれる頂点がそのまま有効エッチング量分布になる。 Next, in the second complete graph obtained in St304, the maximum clique problem is solved to find the vertex set of the maximum clique, and the etching amount distribution corresponding to the vertices included in the vertex set is selected as the effective etching amount distribution (effective learning data) (St305 in FIG. 11). In St305, the maximum clique problem is a type of optimization problem that finds the vertex set with the largest number of vertices that induces a complete graph in a simple undirected graph, and the vertex set of the maximum clique is found by solving this maximum clique problem. In addition, the vertices of the second complete graph are etching conditions, and the etching amount distribution corresponding to the etching conditions included in the vertex set is set as the effective etching amount distribution. Note that if the vertices of the second complete graph are etching amount distributions, the vertices included in the vertex set become the effective etching amount distribution as they are.
かかる場合、St304で第1の完全グラフの辺を除去する際、除去された頂点同士は連結されていないのでクリークにならない。そして、St305で最大クリークとなる頂点集合を求めると、当該頂点集合のすべての頂点同士は連結されている。すなわち、類似される頂点のうち、一方の頂点のみが選定されるので、相違度の低いエッチング量分布(学習データ)、すなわち類似度の高いエッチング量分布を除去することができる。 In this case, when the edges of the first complete graph are removed in St304, the removed vertices are not connected to each other and do not form a clique. Then, when the vertex set that forms the maximum clique is found in St305, all of the vertices in the vertex set are connected to each other. In other words, since only one of the similar vertices is selected, etching amount distributions (learning data) with low dissimilarity, i.e., etching amount distributions with high similarity, can be removed.
図12(c)は、St305で求められる最大クリークの頂点集合の一例を示す。図12(c)中、黒塗りの頂点が最大クリークの頂点集合であり、この頂点集合に含まれる頂点に対応するエッチング量分布を有効エッチング量分布と選定する。 Figure 12(c) shows an example of the vertex set of the maximum clique obtained in St305. In Figure 12(c), the vertices painted in black are the vertex set of the maximum clique, and the etching amount distribution corresponding to the vertices included in this vertex set is selected as the effective etching amount distribution.
以上のようにSt300~St205が行われて、類似するエッチング量分布が除去され、複数の有効学習データが選定される。 Steps 300 to 205 are performed as described above, similar etching amount distributions are eliminated, and multiple valid learning data are selected.
図13は、第2のパターンのグラフ手法を用いて、複数の学習データをスクリーニングする様子を示す説明図である。図13(a)はスクリーニング前の複数の学習データを示し、図13(b)、(c)はスクリーニング後の複数の有効学習データを示す。また、図13(b)ではエッジカットパラメータsが0.1であり(s=0.1)、図10(c)ではエッジカットパラメータsが0.2である(s=0.2)。 FIG. 13 is an explanatory diagram showing how multiple pieces of training data are screened using the second pattern of the graph method. FIG. 13(a) shows multiple pieces of training data before screening, and FIGS. 13(b) and (c) show multiple pieces of valid training data after screening. In addition, in FIG. 13(b), the edge cut parameter s is 0.1 (s=0.1), and in FIG. 10(c), the edge cut parameter s is 0.2 (s=0.2).
図13を参照すると、図13(a)に示した学習データの数が27個であったのに対し、図13(b)に示した有効学習データの数は18個であり、図10(c)に示した有効学習データの数は11個であった。したがって、第2のパターンのグラフ手法を用いた場合、有効学習データを適切に選定することができる。また、相違度のエッジカットパラメータsを大きくするほど、有効学習データの数が少なくなり、有効学習データをより適切に選定できる。 Referring to FIG. 13, the number of training data shown in FIG. 13(a) is 27, whereas the number of valid training data shown in FIG. 13(b) is 18, and the number of valid training data shown in FIG. 10(c) is 11. Therefore, when the second pattern of the graph method is used, valid training data can be appropriately selected. Furthermore, the larger the dissimilarity edge cut parameter s is, the smaller the number of valid training data becomes, and the more appropriately valid training data can be selected.
第2のパターンのグラフ手法を用いた場合、学習データの数を適切に減らして有効学習データを取得することができ、その結果、最適化計算の計算時間を短縮することができる。すなわち、第1のパターンの幾何学手法と同様に、ウェハ処理のスループットを向上させることができる。また、最適化計算を適切に行うことができ、更に新たなエッチング条件の学習データを追加することも可能になる。 When the second pattern of the graph method is used, the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for the optimization calculation can be shortened. In other words, similar to the first pattern of the geometric method, the throughput of wafer processing can be improved. In addition, the optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions.
ここで、St10のエッチング量分布の最適化処理において、類似する学習データを用いた場合、どちらの学習データも採用されて、組み合わせが多く複数になる場合がある。St10の最適化処理では、エッチング条件(リーフ)を切り替えるときのエッチング量分布の表現に正確さが欠けるので、組み合わせ数が多くなるほど最適化誤差(推定誤差)が大きくなる場合がある。 Here, in the optimization process of the etching amount distribution in St10, if similar learning data are used, both sets of learning data may be adopted, resulting in multiple combinations. In the optimization process of St10, the expression of the etching amount distribution when switching etching conditions (leaves) lacks accuracy, so the more combinations there are, the larger the optimization error (estimation error) may become.
この点、第2のパターンのグラフ手法を用いた場合、類似する学習データが除去されるので、エッチング条件数(リーフ数)が減少して、St10の最適化処理における組み合わせがシンプルになり、最適化誤差を小さく抑えることができる。 In this regard, when the second pattern of the graph method is used, similar learning data is removed, so the number of etching conditions (number of leaves) is reduced, the combinations in the optimization process of St10 are simplified, and the optimization error can be kept small.
なお、第2のパターンのグラフ手法において、St301のエッチング量分布行列の次元圧縮は必須ではなく、St301を省略してもよい。 In addition, in the graph method of the second pattern, dimensional compression of the etching amount distribution matrix of St301 is not essential, and St301 may be omitted.
また、第2のパターンのグラフ手法において、St303~St305に代えて、他の方法を用いて類似する学習データを除去してもよい。St302で算出されたエッチング量分布ベクトル間の類似度又は相違度について、類似度が予め定められた閾値以上のエッチング条件のエッチング量分布、又は、相違度が予め定められた閾値以下のエッチング条件のエッチング量分布を除去できれば、任意の方法をとることができる。 In addition, in the graph method of the second pattern, instead of St303 to St305, other methods may be used to remove similar learning data. Any method may be used as long as it is possible to remove etching amount distributions for etching conditions in which the similarity or dissimilarity between the etching amount distribution vectors calculated in St302 is equal to or greater than a predetermined threshold, or etching amount distributions for etching conditions in which the dissimilarity is equal to or less than a predetermined threshold.
第3のパターンでは、QR分解手法を用いて、複数の学習データをスクリーニングする。先ず、エッチング量分布行列Aを取得する(図14のSt400)。エッチング量分布行列Aは、エッチング量分布における測定点数をn点とし、St100の学習処理におけるエッチング条件数をm個とした場合の、エッチング量分布を(n,m)とした行列である。St400におけるエッチング量分布行列Aの取得方法は、St200と同様であるので詳細説明を省略する。 In the third pattern, multiple learning data are screened using the QR decomposition method. First, the etching amount distribution matrix A is obtained (St400 in FIG. 14). The etching amount distribution matrix A is a matrix in which the etching amount distribution is (n, m) when the number of measurement points in the etching amount distribution is n and the number of etching conditions in the learning process of St100 is m. The method of obtaining the etching amount distribution matrix A in St400 is the same as that in St200, so a detailed explanation will be omitted.
ここで、本発明者は、複数の学習データをスクリーニングする方法として、例えば、複数のセンサの最適なセンサ位置を決定するセンサ配置問題を用いることを検討した。センサ配置問題では、センサ配置行列について、センサ集合の数が所望の数pという制約条件のもと、特異値の最小値が最大になるようにセンサ集合を求める。すなわち、センサ配置行列の特異値の総乗が最大(p次元立体の体積が最大)となるセンサ集合を求める。しかしながら、このセンサ配置問題における公知の式をそのまま計算するのは困難である。 The inventors have considered using, for example, a sensor placement problem for determining optimal sensor positions for multiple sensors as a method for screening multiple training data. In the sensor placement problem, a sensor set is determined for a sensor placement matrix such that the minimum singular value is maximized under the constraint that the number of sensor sets is a desired number p. In other words, a sensor set is determined for which the sum of the singular values of the sensor placement matrix is maximized (the volume of a p-dimensional solid is maximized). However, it is difficult to directly calculate the known formula for this sensor placement problem.
そこで、本発明者が鋭意検討し、効率的な計算方法として、センサ配置行列、すなわちエッチング量分布行列Aにピボット選択付きQR分解を行うことを想到した。すなわち、上述したエッチング量分布行列Aの特異値の総乗は、下記式(1)で示すように、エッチング量分布行列AをQR分解した上三角行列Rの対角成分riiの総乗に等しい。なお、QR分解は、(n,m)のエッチング量分布行列Aを、n次直交行列Qと、(n,m)の上三角行列Rとの積に分解する。
また、下記式(2)で示すようにエッチング量分布行列Aにピボット選択付きQR分解を行うことによって、上三角行列Rの対角成分riiは降順、すなわち特異値への寄与が降順になる。なお、ピボットは、エッチング量分布行列Aの行の最も左にあるゼロでない値である。ピボット選択は、0(ゼロ)又は小さな値にならないように、エッチング量分布行列Aの行又は列の入れ替えることである。ピボット選択行列Pは、ピボット選択をした後の行番号を格納した列である。
そして、スクリーニング後の有効学習データの数pになるまで、ピボット選択行列Pの末尾からエッチング量分布のデータを削除する。 Then, delete the etching amount distribution data from the end of the pivot selection matrix P until the number of valid training data after screening reaches p.
以上のセンサ配置問題に相当する方法を実現するため、St400で取得したエッチング量分布行列Aにピボット選択付きQR分解を行う(図14のSt401)。St401では、n=Mの場合、エッチング量分布行列Aにピボット選択付きQR分解を行う。また、n≠Mの場合、エッチング量分布行列の逆行列ATとエッチング量分布行列Aの積ATAにピボット選択付きQR分解を行う。 In order to realize a method corresponding to the above sensor placement problem, QR decomposition with pivot selection is performed on the etching amount distribution matrix A acquired in St400 (St401 in FIG. 14). In St401, when n=M, QR decomposition with pivot selection is performed on the etching amount distribution matrix A. Also, when n≠M, QR decomposition with pivot selection is performed on the product A T A of the inverse matrix A T of the etching amount distribution matrix and the etching amount distribution matrix A.
次に、ピボット選択行列Pと、上三角行列Rの対角成分riiの総乗を取得する(図14のSt402)。本実施形態のSt402では、対角成分riiの総乗は、計算の桁数を抑えるため、下記式(3)で示す値とする。また、ピボット選択を行っているので、自動的に対角成分riiは小さい順に並ぶ。
次に、上三角行列Rの対角成分の末尾rnnを除いた有効総乗を取得する(図14のSt403)。St403で取得される対角成分の有効総乗は、下記式(4)で表される。
次に、上記式(4)で表される対角成分の有効総乗が、予め定められた閾値以下か否かを判断する(図14のSt404)。St404における閾値は、任意に決定することができる。 Next, it is determined whether the effective product of the diagonal elements expressed by the above formula (4) is equal to or less than a predetermined threshold (Step 404 in FIG. 14). The threshold in Step 404 can be determined arbitrarily.
St404で、上記式(4)で表される対角成分の有効総乗が、予め定められた閾値以下の場合、ピボット選択行列Pの末尾に相当するエッチング量分布を除去する(図14のSt405)。続いて、St403の処理に戻る。 In step 404, if the effective product of the diagonal elements expressed by the above formula (4) is equal to or less than a predetermined threshold, the etching amount distribution corresponding to the end of the pivot selection matrix P is removed (step 405 in FIG. 14). Then, the process returns to step 403.
上述したSt403~St405を繰り返し行う。そして、St404において上記式(4)で表される対角成分の有効総乗が、予め定められた閾値より大きくなると、一連の処理を終了し、複数の有効エッチング量分布(複数の有効学習データ)が選定される(図14のSt406)。すなわち、St402でピボット選択行列Pが取得されて、St404で対角成分の末尾rnnが除外されるので、St406ではエッチング量分布行列Aが最大化されて、複数の有効エッチング量分布が選定される。 The above-mentioned steps St403 to St405 are repeated. Then, when the effective sum of the diagonal components expressed by the above formula (4) becomes larger than a predetermined threshold in St404, the series of processes is terminated, and multiple effective etching amount distributions (multiple effective learning data) are selected (St406 in FIG. 14). That is, the pivot selection matrix P is acquired in St402, and the tails r nn of the diagonal components are removed in St404, so that the etching amount distribution matrix A is maximized in St406, and multiple effective etching amount distributions are selected.
第3のパターンのQR分解手法を用いた場合、学習データの数を適切に減らして有効学習データを取得することができ、その結果、最適化計算の計算時間を短縮することができる。すなわち、第1のパターンの幾何学手法及び第2のパターンのグラフ手法と同様に、ウェハ処理のスループットを向上させることができる。また、最適化計算を適切に行うことができ、更に新たなエッチング条件の学習データを追加することも可能になる。 When the QR decomposition method of the third pattern is used, the number of learning data can be appropriately reduced to obtain valid learning data, and as a result, the calculation time for optimization calculation can be shortened. In other words, similar to the geometric method of the first pattern and the graph method of the second pattern, the throughput of wafer processing can be improved. In addition, optimization calculation can be performed appropriately, and it is also possible to add learning data for new etching conditions.
また、第3のパターンのQR分解手法を用いた場合、類似する学習データが除去されるので、エッチング条件数(リーフ数)が減少して、St10の最適化処理における組み合わせがシンプルになり、最適化誤差を小さく抑えることができる。 In addition, when the third pattern of the QR decomposition method is used, similar learning data is removed, so the number of etching conditions (number of leaves) is reduced, the combinations in the optimization process of St10 are simplified, and the optimization error can be kept small.
なお、第3のパターンのQR分解手法を用いた場合、St10のエッチング量分布の最適化処理に不要なデータも除去することができる。 In addition, when using the third pattern QR decomposition method, data unnecessary for the optimization process of the etching amount distribution of St10 can also be removed.
なお、第3のパターンのQR分解手法において、St400のエッチング量分布行列Aの次元を圧縮し、r次元のエッチング量分布行列Arを取得してもよい。この次元圧縮方法は、St201と同様である。そして、St401以降では、次元圧縮したエッチング量分布行列Arを用いてQR分解等の処理を行う。 In the QR decomposition method of the third pattern, the dimension of the etching amount distribution matrix A in St400 may be compressed to obtain an r-dimensional etching amount distribution matrix A r . This dimension compression method is the same as that in St201. Then, in and after St401, the QR decomposition and other processes are performed using the dimension-compressed etching amount distribution matrix A r .
以上の第1のパターンの幾何学手法と第2のパターンのグラフ手法を組み合わせて、複数の学習データをスクリーニングしてもよい。先ず、第1のパターンの幾何学手法において、St200~St203を行い、第1の有効エッチング量分布(第1の有効学習データ)を選定する。次に、第2のパターンのグラフ手法において、第1の有効エッチング量分布を用いてSt300~St305を行い、第2の有効エッチング量分布(第2の有効学習データ)を選定する。 The above first pattern of geometric method and second pattern of graphical method may be combined to screen multiple learning data. First, in the first pattern of geometric method, steps St200 to St203 are performed to select a first effective etching amount distribution (first effective learning data). Next, in the second pattern of graphical method, steps St300 to St305 are performed using the first effective etching amount distribution to select a second effective etching amount distribution (second effective learning data).
かかる場合、第1のパターンの幾何学手法において、St10のエッチング量分布の最適化処理に不要なデータを除去することができ、更に第2のパターンのグラフ手法において、類似するエッチング量分布も除去することができる。したがって、有効学習データの選定をより適切に行うことができる。なお、第1のパターンの幾何学手法と第2のパターンのグラフ手法の順序は本実施形態に限定されず、第2のパターンのグラフ手法を行った後、第1のパターンの幾何学手法を行ってもよい。 In such a case, the first pattern geometric method can remove data that is not necessary for the optimization process of the etching amount distribution of St10, and the second pattern graphical method can also remove similar etching amount distributions. Therefore, it is possible to more appropriately select valid learning data. Note that the order of the first pattern geometric method and the second pattern graphical method is not limited to this embodiment, and the first pattern geometric method may be performed after the second pattern graphical method.
同様に、以上の第1のパターンの幾何学手法と第3のパターンのQR分解手法を組み合わせて、複数の学習データをスクリーニングしてもよい。先ず、第1のパターンの幾何学手法において、St200~St203を行い、第1の有効エッチング量分布(第1の有効学習データ)を選定する。次に、第3のパターンのQR分解手法において、第1の有効エッチング量分布を用いてSt400~St406を行い、第2の有効エッチング量分布(第2の有効学習データ)を選定する。 Similarly, the above-mentioned first pattern of geometric method and the third pattern of QR decomposition method may be combined to screen multiple learning data. First, in the first pattern of geometric method, St200 to St203 are performed to select a first effective etching amount distribution (first effective learning data). Next, in the third pattern of QR decomposition method, St400 to St406 are performed using the first effective etching amount distribution to select a second effective etching amount distribution (second effective learning data).
かかる場合、第1のパターンの幾何学手法において、St10のエッチング量分布の最適化処理に不要なデータを除去することができ、更に第3のパターンのQR分解手法において、類似するエッチング量分布も除去することができる。したがって、有効学習データの選定をより適切に行うことができる。なお、第1のパターンの幾何学手法と第3のパターンのQR分解手法の順序は本実施形態に限定されず、第3のパターンのQR分解手法を行った後、第1のパターンの幾何学手法を行ってもよい。 In such a case, the geometric method of the first pattern can remove data that is not necessary for the optimization process of the etching amount distribution of St10, and further, the QR decomposition method of the third pattern can remove similar etching amount distributions. Therefore, it is possible to more appropriately select valid learning data. Note that the order of the geometric method of the first pattern and the QR decomposition method of the third pattern is not limited to this embodiment, and the geometric method of the first pattern may be performed after the QR decomposition method of the third pattern.
以上の実施形態では、ウェハWのエッチング処理を制御するためのエッチング指標分布(学習データ)として、エッチング量分布を用いたが、エッチング量偏差分布を用いてもよい。エッチング量偏差分布は、ウェハ面内のエッチング量から、当該エッチング量の平均値を差し引いた値の分布である。かかる場合、St10において最適エッチング条件を決定する際に、エッチング量分布に代えて、エッチング量偏差分布を用いる。 In the above embodiment, the etching amount distribution is used as the etching index distribution (learning data) for controlling the etching process of the wafer W, but the etching amount deviation distribution may also be used. The etching amount deviation distribution is a distribution of values obtained by subtracting the average value of the etching amount from the etching amount within the wafer surface. In such a case, when determining the optimal etching conditions in St10, the etching amount deviation distribution is used instead of the etching amount distribution.
以上の実施形態では、インゴットからワイヤーソー等により切り出され、又はラッピングされたウェハWの両面(第1の表面Wa及び第2の表面Wb)に各種処理を施す場合を例に説明を行ったが、ウェハWの片面のみに各種処理が施されてもよい。 In the above embodiment, an example has been described in which various processes are performed on both sides (first surface Wa and second surface Wb) of a wafer W that has been cut from an ingot using a wire saw or lapped, but various processes may be performed on only one side of the wafer W.
また以上の実施形態では、インゴットからワイヤーソー等により切り出され、又はラッピングされたウェハWに各種処理を施す場合を例に説明を行ったが、例えば半導体デバイスの製造工程における後処理工程においても、本開示の技術を適用できる。具体的には、例えば第1のウェハと第2のウェハが接合して構成される重合ウェハにおいて、第1のウェハを研削した後、研削後の第1のウェハの表面をエッチングする場合においても、本開示の技術を適用できる。 In the above embodiment, various processes are performed on a wafer W that has been cut from an ingot using a wire saw or lapped, but the technology disclosed herein can also be applied to post-processing steps in the manufacturing process of semiconductor devices. Specifically, the technology disclosed herein can also be applied to a laminated wafer formed by bonding a first wafer and a second wafer, in which the first wafer is ground and then the surface of the ground first wafer is etched.
今回開示された実施形態はすべての点で例示であって制限的なものではないと考えられるべきである。上記の実施形態は、添付の請求の範囲及びその主旨を逸脱することなく、様々な形態で省略、置換、変更されてもよい。例えば、上記実施形態の構成要件は任意に組み合わせることができる。当該任意の組み合せからは、組み合わせにかかるそれぞれの構成要件についての作用及び効果が当然に得られるとともに、本明細書の記載から当業者には明らかな他の作用及び他の効果が得られる。 The embodiments disclosed herein should be considered to be illustrative and not restrictive in all respects. The above-described embodiments may be omitted, substituted, or modified in various ways without departing from the spirit and scope of the appended claims. For example, the components of the above-described embodiments may be combined in any manner. Such any combination will naturally provide the functions and effects of each of the components in the combination, as well as other functions and effects that will be apparent to a person skilled in the art from the description in this specification.
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、又は、上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。 Furthermore, the effects described in this specification are merely descriptive or exemplary and are not limiting. In other words, the technology disclosed herein may achieve other effects that are apparent to a person skilled in the art from the description in this specification, in addition to or in place of the above effects.
1 ウェハ処理システム
40 エッチング装置
130 制御装置
W ウェハ
1
Claims (20)
エッチング量分布の最適化処理を行い、最適エッチング条件を決定することと、
前記最適エッチング条件に基づいて、基板の表面にエッチング液を供給して、当該表面をエッチングすることと、を含み、
前記最適エッチング条件を決定することは、
複数の異なるエッチング条件で基板の表面をエッチングした際の、径方向の複数のエッチング量分布を取得することと、
前記複数のエッチング量分布に対してスクリーニング処理を行い、前記最適化処理に不要なエッチング量分布と、類似するエッチング量分布との少なくともいずれかを除去して、複数の有効エッチング量分布を選定することと、
最適化手法を用いて、前記複数の有効エッチング量分布を重ね合わせて、基板の表面の形状が目標形状になるように、重ね合わせに用いる前記有効エッチング量分布と、当該有効エッチング量分布を重ね合わせる回数との組み合わせを最適化することと、
前記最適化された組み合わせに対応するエッチング条件を統合して前記最適エッチング条件を決定することと、を含む、基板処理方法。 A substrate processing method for processing a substrate, comprising the steps of:
Optimizing the etching amount distribution to determine optimal etching conditions;
supplying an etching solution to a surface of the substrate based on the optimal etching conditions to etch the surface;
Determining the optimal etching conditions includes:
Obtaining a plurality of radial etching amount distributions when etching a surface of a substrate under a plurality of different etching conditions;
performing a screening process on the plurality of etching amount distributions to remove at least one of an etching amount distribution unnecessary for the optimization process and a similar etching amount distribution, thereby selecting a plurality of effective etching amount distributions;
optimizing a combination of the effective etching amount distributions used for superposition and the number of times the effective etching amount distributions are superposed, by using an optimization method, so that the shape of the surface of the substrate becomes a target shape;
and determining the optimal etching conditions by integrating the etching conditions corresponding to the optimized combinations.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得することと、
前記エッチング量分布ベクトルを頂点とした凸包を取得することと、
前記凸包の内部に存在する前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定することと、を含む、請求項1に記載の基板処理方法。 Selecting the plurality of effective etching amount distributions includes:
acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
Obtaining a convex hull with the etching amount distribution vector as a vertex;
The substrate processing method according to claim 1 , further comprising: removing the etching amount distribution existing inside the convex hull to select the plurality of effective etching amount distributions.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得することと、
前記エッチング量分布ベクトル間の類似度又は相違度を算出することと、
前記類似度が予め定められた閾値以上のエッチング条件の前記エッチング量分布、又は、前記相違度が予め定められた閾値以下のエッチング条件の前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定することと、を含む、請求項1に記載の基板処理方法。 Selecting the plurality of effective etching amount distributions includes:
acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
Calculating a similarity or a difference between the etching amount distribution vectors;
and selecting the plurality of effective etching amount distributions by removing the etching amount distributions of the etching conditions in which the degree of similarity is equal to or greater than a predetermined threshold, or the etching amount distributions of the etching conditions in which the degree of dissimilarity is equal to or less than a predetermined threshold.
前記第1の完全グラフにおいて、前記類似度が予め定められた閾値以上の辺、又は、前記相違度が予め定められた閾値以下の辺を除去して、第2の完全グラフを取得することと、
前記第2の完全グラフにおいて最大クリークの頂点集合を求め、当該頂点集合に含まれる頂点に対応する前記エッチング量分布を前記複数の有効エッチング量分布と選定することと、を含む、請求項4に記載の基板処理方法。 obtaining a first complete graph having the etching conditions or the etching amount distribution as vertices and the similarities or the dissimilarities as edges;
removing, from the first complete graph, edges whose similarity is equal to or greater than a predetermined threshold or edges whose dissimilarity is equal to or less than a predetermined threshold, to obtain a second complete graph;
5. The substrate processing method according to claim 4, further comprising: determining a vertex set of a maximum clique in the second complete graph; and selecting the etching amount distributions corresponding to vertices included in the vertex set as the plurality of effective etching amount distributions.
前記エッチング量分布における複数の測定点の数を行数とし、前記複数のエッチング条件の数を列数とし、前記エッチング量分布におけるエッチング量を成分とするエッチング量分布行列を取得することと、
前記エッチング量分布行列にピボット選択付きQR分解を行い、ピボット選択行列を取得することと、
前記ピボット選択行列の末尾に相当する前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定することと、を含む、請求項1に記載の基板処理方法。 Selecting the plurality of effective etching amount distributions includes:
acquiring an etching amount distribution matrix having a number of the measurement points in the etching amount distribution as a row number, a number of the etching conditions as a column number, and an etching amount distribution matrix having the etching amounts in the etching amount distribution as components;
performing QR decomposition with pivot selection on the etching amount distribution matrix to obtain a pivot selection matrix;
2. The substrate processing method according to claim 1, further comprising: selecting the plurality of effective etching amount distributions by removing the etching amount distribution corresponding to a tail of the pivot selection matrix.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得することと、
前記エッチング量分布ベクトルを頂点とした凸包を取得することと、
前記凸包の内部に存在する前記エッチング量分布を除去して、複数の第1の有効エッチング量分布を選定することと、
前記第1の有効エッチング量分布間の類似度又は相違度を算出することと、
前記類似度が予め定められた閾値以上のエッチング条件の前記エッチング量分布、又は、前記相違度が予め定められた閾値以下のエッチング条件の前記エッチング量分布を除去して、複数の第2の有効エッチング量分布を選定することと、を含む、請求項1に記載の基板処理方法。 Selecting the plurality of effective etching amount distributions includes:
acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
Obtaining a convex hull with the etching amount distribution vector as a vertex;
removing the etching amount distribution existing inside the convex hull to select a plurality of first effective etching amount distributions;
Calculating a similarity or a difference between the first effective etching amount distributions;
and selecting a plurality of second effective etching amount distributions by removing the etching amount distributions of etching conditions in which the similarity is equal to or greater than a predetermined threshold value, or the etching amount distributions of etching conditions in which the dissimilarity is equal to or less than a predetermined threshold value.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得することと、
前記エッチング量分布ベクトルを頂点とした凸包を取得することと、
前記凸包の内部に存在する前記エッチング量分布を除去して、複数の第1の有効エッチング量分布を選定することと、
前記第1の有効エッチング量分布における複数の測定点の数を行数とし、前記複数のエッチング条件の数を列数とし、前記第1の有効エッチング量分布におけるエッチング量を成分とするエッチング量分布行列を取得することと、
前記エッチング量分布行列にピボット選択付きQR分解を行い、ピボット選択行列を取得することと、
前記ピボット選択行列の末尾に相当する前記エッチング量分布を除去して、複数の第2の有効エッチング量分布を選定することと、を含む、請求項1に記載の基板処理方法。 Selecting the plurality of effective etching amount distributions includes:
acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
Obtaining a convex hull with the etching amount distribution vector as a vertex;
removing the etching amount distribution existing inside the convex hull to select a plurality of first effective etching amount distributions;
acquiring an etching amount distribution matrix having a number of a plurality of measurement points in the first effective etching amount distribution as a row number, a number of the plurality of etching conditions as a column number, and an etching amount distribution matrix having an etching amount in the first effective etching amount distribution as a component;
performing QR decomposition with pivot selection on the etching amount distribution matrix to obtain a pivot selection matrix;
2. The substrate processing method according to claim 1, further comprising: removing the etching amount distribution corresponding to a tail of the pivot selection matrix to select a plurality of second effective etching amount distributions.
基板の表面にエッチング液を供給して、当該表面をエッチングするエッチング装置と、
最適エッチング条件に基づいて、前記エッチング装置における基板のエッチングを制御する制御装置と、を有し、
前記制御装置は、
複数の異なるエッチング条件で基板の表面をエッチングした際の、径方向の複数のエッチング量分布を取得する制御と、
前記複数のエッチング量分布に対してスクリーニング処理を行い、前記エッチング量分布の最適化処理に不要なエッチング量分布と、類似するエッチング量分布との少なくともいずれかを除去して、複数の有効エッチング量分布を選定する制御と、
最適化手法を用いて、前記複数の有効エッチング量分布を重ね合わせて、基板の表面の形状が目標形状になるように、重ね合わせに用いる前記有効エッチング量分布と、当該有効エッチング量分布を重ね合わせる回数との組み合わせを最適化する制御と、
前記最適化された組み合わせに対応するエッチング条件を統合して前記最適エッチング条件を決定する制御と、を実行する、基板処理システム。 A substrate processing system for processing a substrate, comprising:
an etching device that supplies an etching solution to a surface of a substrate to etch the surface;
a control device that controls etching of the substrate in the etching device based on optimal etching conditions;
The control device includes:
A control for acquiring a plurality of radial etching amount distributions when the surface of the substrate is etched under a plurality of different etching conditions;
a control for selecting a plurality of effective etching amount distributions by performing a screening process on the plurality of etching amount distributions and removing at least one of an etching amount distribution unnecessary for the optimization process of the etching amount distribution and a similar etching amount distribution;
using an optimization method to optimize a combination of the effective etching amount distributions used for the overlapping and the number of times the effective etching amount distributions are overlapped, so that the shape of the surface of the substrate becomes a target shape;
and determining the optimal etching conditions by integrating the etching conditions corresponding to the optimized combination.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得する制御と、
前記エッチング量分布ベクトルを頂点とした凸包を取得する制御と、
前記凸包の内部に存在する前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定する制御と、を実行する、請求項11に記載の基板処理システム。 The control device includes:
Control for acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
A control to obtain a convex hull having the etching amount distribution vector as a vertex;
12. The substrate processing system according to claim 11, further comprising: a control for selecting the plurality of effective etching amount distributions by removing the etching amount distribution existing inside the convex hull.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得する制御と、
前記エッチング量分布ベクトル間の類似度又は相違度を算出する制御と、
前記類似度が予め定められた閾値以上のエッチング条件の前記エッチング量分布、又は、前記相違度が予め定められた閾値以下のエッチング条件の前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定する制御と、を実行する、請求項11に記載の基板処理システム。 The control device includes:
Control for acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
A control for calculating a similarity or a difference between the etching amount distribution vectors;
and selecting the plurality of effective etching amount distributions by removing the etching amount distributions of the etching conditions in which the similarity is equal to or greater than a predetermined threshold value, or the etching amount distributions of the etching conditions in which the dissimilarity is equal to or less than a predetermined threshold value.
前記エッチング条件又は前記エッチング量分布を頂点とし、前記類似度又は前記相違度を辺とする第1の完全グラフを取得する制御と、
前記第1の完全グラフにおいて、前記類似度が予め定められた閾値以上の辺、又は、前記相違度が予め定められた閾値以下の辺を除去して、第2の完全グラフを取得する制御と、
前記第2の完全グラフにおいて最大クリークの頂点集合を求め、当該頂点集合に含まれる頂点に対応する前記エッチング量分布を前記複数の有効エッチング量分布と選定する制御と、を実行する、請求項14に記載の基板処理システム。 The control device includes:
A control for acquiring a first complete graph having the etching condition or the etching amount distribution as vertices and the similarity or the dissimilarity as edges;
a control for removing, from the first complete graph, an edge whose similarity is equal to or greater than a predetermined threshold or an edge whose dissimilarity is equal to or less than a predetermined threshold, to obtain a second complete graph;
15. The substrate processing system according to claim 14, further comprising: a control for determining a vertex set of a maximum clique in the second complete graph, and selecting the etching amount distributions corresponding to vertices included in the vertex set as the plurality of effective etching amount distributions.
前記エッチング量分布における複数の測定点の数を行数とし、前記複数のエッチング条件の数を列数とし、前記エッチング量分布におけるエッチング量を成分とするエッチング量分布行列を取得する制御と、
前記エッチング量分布行列にピボット選択付きQR分解を行い、ピボット選択行列を取得する制御と、
前記ピボット選択行列の末尾に相当する前記エッチング量分布を除去して、前記複数の有効エッチング量分布を選定する制御と、を実行する、請求項11に記載の基板処理システム。 The control device includes:
a control for acquiring an etching amount distribution matrix in which the number of the measurement points in the etching amount distribution is the number of rows, the number of the etching conditions is the number of columns, and the etching amounts in the etching amount distribution are components;
A control of performing QR decomposition with pivot selection on the etching amount distribution matrix to obtain a pivot selection matrix;
12. The substrate processing system according to claim 11, further comprising: a control for selecting the plurality of effective etching amount distributions by removing the etching amount distribution corresponding to a tail of the pivot selection matrix.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得する制御と、
前記エッチング量分布ベクトルを頂点とした凸包を取得する制御と、
前記凸包の内部に存在する前記エッチング量分布を除去して、複数の第1の有効エッチング量分布を選定する制御と、
前記第1の有効エッチング量分布間の類似度又は相違度を算出する制御と、
前記類似度が予め定められた閾値以上のエッチング条件の前記エッチング量分布、又は、前記相違度が予め定められた閾値以下のエッチング条件の前記エッチング量分布を除去して、複数の第2の有効エッチング量分布を選定する制御と、を実行する、請求項11に記載の基板処理システム。 The control device includes:
Control for acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
A control to obtain a convex hull having the etching amount distribution vector as a vertex;
a control for selecting a plurality of first effective etching amount distributions by removing the etching amount distribution existing inside the convex hull;
A control for calculating a similarity or a difference between the first effective etching amount distributions;
and selecting a plurality of second effective etching amount distributions by removing the etching amount distributions of etching conditions in which the similarity is equal to or greater than a predetermined threshold value, or the etching amount distributions of etching conditions in which the dissimilarity is equal to or less than a predetermined threshold value.
前記エッチング条件毎に、前記エッチング量分布における複数の測定点のエッチング量を成分とするエッチング量分布ベクトルを取得する制御と、
前記エッチング量分布ベクトルを頂点とした凸包を取得する制御と、
前記凸包の内部に存在する前記エッチング量分布を除去して、複数の第1の有効エッチング量分布を選定する制御と、
前記第1の有効エッチング量分布における複数の測定点の数を行数とし、前記複数のエッチング条件の数を列数とし、前記第1の有効エッチング量分布におけるエッチング量を成分とするエッチング量分布行列を取得する制御と、
前記エッチング量分布行列にピボット選択付きQR分解を行い、ピボット選択行列を取得する制御と、
前記ピボット選択行列の末尾に相当する前記エッチング量分布を除去して、複数の第2の有効エッチング量分布を選定する制御と、を実行する、請求項11に記載の基板処理システム。 The control device includes:
Control for acquiring an etching amount distribution vector having etching amounts at a plurality of measurement points in the etching amount distribution as components for each of the etching conditions;
A control to obtain a convex hull having the etching amount distribution vector as a vertex;
a control for selecting a plurality of first effective etching amount distributions by removing the etching amount distribution existing inside the convex hull;
a control for acquiring an etching amount distribution matrix in which the number of the measurement points in the first effective etching amount distribution is the number of rows, the number of the etching conditions is the number of columns, and the etching amount distribution matrix has the etching amounts in the first effective etching amount distribution as components;
A control of performing QR decomposition with pivot selection on the etching amount distribution matrix to obtain a pivot selection matrix;
12. The substrate processing system according to claim 11, further comprising: a control for selecting a plurality of second effective etching amount distributions by removing the etching amount distribution corresponding to a tail of the pivot selection matrix.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023183935 | 2023-10-26 | ||
| JP2023-183935 | 2023-10-26 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025089153A1 true WO2025089153A1 (en) | 2025-05-01 |
Family
ID=95515497
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2024/036813 Pending WO2025089153A1 (en) | 2023-10-26 | 2024-10-16 | Substrate processing method and substrate processing system |
Country Status (1)
| Country | Link |
|---|---|
| WO (1) | WO2025089153A1 (en) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06180691A (en) * | 1992-12-11 | 1994-06-28 | Fujitsu Ltd | Adaptive input/output device |
| JP2007227618A (en) * | 2006-02-23 | 2007-09-06 | Hitachi High-Technologies Corp | Semiconductor process monitoring method and system |
| CN113555127A (en) * | 2021-07-22 | 2021-10-26 | 常州工业职业技术学院 | Neural network model-based COPD diagnostic information sensitive data mining method |
| JP2023067122A (en) * | 2021-10-29 | 2023-05-16 | 東京エレクトロン株式会社 | Substrate processing method and substrate processing system |
-
2024
- 2024-10-16 WO PCT/JP2024/036813 patent/WO2025089153A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06180691A (en) * | 1992-12-11 | 1994-06-28 | Fujitsu Ltd | Adaptive input/output device |
| JP2007227618A (en) * | 2006-02-23 | 2007-09-06 | Hitachi High-Technologies Corp | Semiconductor process monitoring method and system |
| CN113555127A (en) * | 2021-07-22 | 2021-10-26 | 常州工业职业技术学院 | Neural network model-based COPD diagnostic information sensitive data mining method |
| JP2023067122A (en) * | 2021-10-29 | 2023-05-16 | 東京エレクトロン株式会社 | Substrate processing method and substrate processing system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4799817B2 (en) | Semiconductor wafer surface flattening device | |
| JP7717184B2 (en) | Substrate processing method and substrate processing system | |
| KR101607367B1 (en) | High throughput cmp platform | |
| KR20180127202A (en) | Substrate processing apparatus and storage medium having program stored therein | |
| JP7773884B2 (en) | Substrate processing method and substrate processing system | |
| WO2025089153A1 (en) | Substrate processing method and substrate processing system | |
| JP2025120456A (en) | Substrate processing method, substrate processing system, and program | |
| TW202443683A (en) | Substrate processing method and substrate processing system | |
| JP7717185B2 (en) | Substrate processing method and substrate processing system | |
| JP7717186B2 (en) | Substrate processing method and substrate processing system | |
| US20250316506A1 (en) | Substrate processing method and substrate processing system | |
| JP2023168086A (en) | Substrate processing method and substrate processing system | |
| JP2012033585A (en) | Polishing apparatus and polishing method | |
| US20240290607A1 (en) | Substrate processing method, substrate processing system and computer-readable recording medium | |
| WO2025089152A1 (en) | Substrate processing method and substrate processing system | |
| JP7690056B2 (en) | SUBSTRATE PROCESSING METHOD AND SUBSTRATE PROCESSING SYSTEM | |
| WO2025047459A1 (en) | Substrate processing method and substrate processing system | |
| WO2025041580A1 (en) | Substrate processing method and substrate processing system | |
| JP2022125928A (en) | Processing method and processing equipment | |
| WO2025229869A1 (en) | Substrate processing method, substrate processing device, and computer storage medium | |
| WO2025197673A1 (en) | Substrate processing method, substrate processing device, and computer storage medium | |
| CN118103956A (en) | Substrate processing method and substrate processing system | |
| US20060046618A1 (en) | Methods and systems for determining physical parameters of features on microfeature workpieces | |
| WO2025028254A1 (en) | Substrate processing method and substrate processing system | |
| WO2025028253A1 (en) | Substrate processing method and substrate processing system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 24882266 Country of ref document: EP Kind code of ref document: A1 |